使用软件:barrnap(需要在合适的环境中配合运行)
barrnap其实 除了自己一个文件以外,还会配合bedtools来抽取fasta中的序列,否则会因为格式问题报错而不产生所需的文件
准备文件:
-
contig.fasta
(就是拼好的序列scaffold.fasta也可以用的) - 注释好的
.gff3
文件
软件安装
Conda
conda install -c bioconda -c conda-forge barrnap
Homebrew(MacOS/Linux用户)
brew install brewsci/bio/barrnap
到底需不需要特意去安装呢,笔者认为是不需要的,因为这个软件内置在微生物注释常用软件Prokka内,意味着使用prokka进行初步注释后已经可以抽取16S rRNA基因序列了
常用代码/命令
# 查看帮助
barrnap -h
# contigs.fa 输入的是拼接好的菌种.fasta的文件,两边的 'rrna.fa', 'rrna.gff'是为了
# 把gff上的信息与序列信息相对应)-o 是输出文件名&地址
barrnap -o output.fa contigs.fa your_species.gff
##查看序列头三行
head -n 3 rrna.fa
得到下列结果
16S_rRNA::gi|329138943|tpg|BK006945.2|:455935-456864(-)
ACGGTCGGGGGCATCAGTATTCAATTGTCAGAGGTGAAA
TTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTG
CCAAGGACGTTTTCATTA
如何验证
- 建议自己先做个16S rRNA的测序,并上传至
Ezbiocloud
进行序列比对。后面从基因组中抽出来的序列也上传至Ezbiocloud
进行序列比对,看种属信息是否一致。(PS:Ezbiocloud/NCBI
都可以,看自己个人喜欢)
参考
下面的网址是官方详细的教程
https://github.com/tseemann/barrnap/blob/master/README.md#barrnap