参考文档:http://trinotate.github.io/
测试发现,使用 bioconda 安装 Trinotate 软件包会改变目录结构,所以选择手动安装。
安装依赖软件
Trinotate 依赖的软件可以选择使用 bioconda 自动化安装。bioconda 的使用参考课程《生物信息软件安装》。
bioconda 在国内使用可能会很慢,需要翻墙。我用的是付费软件多态(不是广告啊,跟我没关系)。
部署数据库
部署数据库需要五六个小时,如果你使用的是 GenekServer, 可以直接使用我部署好的,路径是/home/zxd/database/Trinotate
自己部署,请按照如下步骤
写如下代码:
TRINOTATE_HOME=/home/genektv/software/Trinotate-3.0.2
$TRINOTATE_HOME/admin/Build_Trinotate_Boilerplate_SQLite_db.pl Trinotate20170505
因为构建数据库需要较长时间,使用nohup sh Build_Trinotate_db.sh &运行脚本。
在运行过程中,首先会从网上下载几个数据库。下载地址在Build_Trinotate_Boilerplate_SQLite_db.pl的代码中可以看到。
17 ## Resources:
18 my $SPROT_DAT_URL = "ftp://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.dat.gz";
19 my $EGGNOG_DAT_URL = "http://eggnogdb.embl.de/download/latest/data/NOG/NOG.annotations.tsv.gz";
20 my $GENE_ONTOLOGY_DAT_URL = "http://purl.obolibrary.org/obo/go/go-basic.obo";
21 my $PFAM_DAT_URL = "ftp://ftp.ebi.ac.uk/pub/databases/Pfam/current_release/Pfam-A.hmm.gz";
22 my $PFAM2GO_DAT_URL = "http://www.geneontology.org/external2go/pfam2go";
如果运行构建数据库过程中出错,通常是下载数据网速太慢导致的,可以多试几次。