Published at 2023-05-29 11:23
Author:liujr
View:1149
abricate 是 tseemann 开发的注释工具,可以对细菌基因组数据进行扫描,获得其基因组携带那些毒力基因和耐药基因结果。软件包含数据库,也可自建数据库进行比对。
conda install abricate
安装完成后,运行
abricate --check
Checking dependencies are installed:
Found 'blastn' => /opt/miniconda3/envs/annotations/bin/blastn
Found 'blastx' => /opt/miniconda3/envs/annotations/bin/blastx
Found 'makeblastdb' => /opt/miniconda3/envs/annotations/bin/makeblastdb
Found 'blastdbcmd' => /opt/miniconda3/envs/annotations/bin/blastdbcmd
Found 'any2fasta' => /opt/miniconda3/envs/annotations/bin/any2fasta
Found 'gzip' => /usr/bin/gzip
Found 'unzip' => /opt/miniconda3/envs/annotations/bin/unzip
OK.
更多安装信息可以查询
https://github.com/tseemann/abricate
查看现有数据库
abricate --list
目前 ABRicate 内置了部分数据库
DATABASE SEQUENCES DBTYPE DATE
resfinder 3077 nucl 2021-Mar-27 #resfinder耐药数据库
argannot 2223 nucl 2021-Mar-27 #argannot耐药数据库
ecoh 597 nucl 2021-Mar-27 #大肠杆菌O/H抗原分析
vfdb_setB 32439 nucl 2023-Feb-15 #vfdb毒力基因数据库
ecoli_vf 2701 nucl 2021-Mar-27 #大肠杆菌毒力基因
megares 6635 nucl 2021-Mar-27 #megares耐药数据库
ncbi 5386 nucl 2021-Mar-27 #NCBI的耐药数据库
card 2631 nucl 2021-Mar-27 #加拿大CARD耐药数据库
plasmidfinder 460 nucl 2021-Mar-27 #质粒扫描
ABRicate 自带的数据库如果没有合适的,或者自己找到更好的数据库,我们可以自建数据库用于比对。我们需要找到 ABRicate 的数据库文件路径,以 vfdb 最新毒力因子预测文件为例,新建一个数据库:
[user@server ~] cd /opt/miniconda3/envs/annotations/db
[user@server ~] mkdir database #新建目录用于存放数据库文件
[user@server ~] cd database
[user@server ~] cp VFDB_setB_pro_1.fas database #将 VFDB_setB_pro_1.fa 复制到database里,并且改名为sequences
[user@server ~] makeblastdb -in sequences -title listeria -dbtype prot #利用blast自带的makeblastdb命令进行建库
对基因组进行毒力因子注释:
[user@server ~] abricate --db vfdb --mincov 90 --minid 95 --csv GCF_000671295.1.fna > vfdb.result.csv
其中
--mincov 覆盖度
--minid 相似度
--csv 以csv文件输出结果,若后续有分析要求,也可直接输出.tab文件
如果我们要对多个基因组进行注释,也可以批量进行
[user@server ~] abricate ./*.fna --threads 10 --db vfdb --mincov 90 --minid 95 > results.tab
[user@server ~] abricate --summary results.tab > summary.tab
通过毒力因子数据库进行注释,可显示基因组找到了20个符合条件的毒力因子
Using nucl database vfdb: 2597 sequences - 2021-Mar-27
Processing: ./GCA_910593775.1.fna
Found 20 genes in ./GCA_910593775.1.fna
Tip: it's important to realise abricate uses DNA matching, not AA.
Done.
具体毒力因子可查看 results.tab 文件,如果想查看耐药因子,只需改变所用数据库就可以。