Kraken2+Bracken

1. 简介

Kraken2是一个基于k-mer算法的高精度宏基因组序列分类软件,能够快速的将测序reads进行物种分类。

Kraken2官网

Bracken (Bayesian Reestimation of Abundance with KrakEN)是一种高精度统计方法,结合Kraken可以实现高准确度的宏基因组测序数据物种分类分析。

Bracken官网

Kraken和Bracken的更多介绍可以参考:宏基因组序列物种分类之kraken 1/2和Bracken的使用

2. 软件安装和数据库下载

Kraken2安装

# 源码安装
git clone https://github.com/DerrickWood/kraken2.git
cd kraken2
sh install_kraken2.sh  ~/bin/kraken2  # 安装路径(编译后文件存储文件夹)
~/bin/kraken2/kraken2 --help  #可加入到环境变量,方便使用

# conda安装(推荐,可以帮忙解决很多依赖)
conda install -y kraken2
kraken2 --help

Bracken安装

# 源码安装(推荐,后续要用到其中的子程序)
git clone https://github.com/jenniferlu717/Bracken.git
cd Bracken
bash install_bracken.sh
cd src/ && make
../bracken -h # 可将bracken加入环境变量方便使用,绝对路径为~/software/Bracken/bracken

# conda安装
conda install -y bracken
brcken -h

数据库下载(第一种方式)

直接下载Kraken官网索引好的数据库。

# 可直接在下载页面下载
# http://ccb.jhu.edu/software/kraken2/downloads.shtml
# MiniKraken2_v1_8GB 包含了细菌(acteria)、古菌( archaea)和病毒(viral)
# MiniKraken2_v2_8GB 在v1的基础上加入了人基因组(GRCh38)
wget ftp://ftp.ccb.jhu.edu/pub/data/kraken2_dbs/old/minikraken2_v1_8GB_201904.tgz
tar zxvf minikraken2_v1_8GB_201904_UPDATE.tgz -C ./ #绝对路径为~/db/minikraken2_v1_8GB/

# Bracken数据库构建
~/software/Bracken/bracken-build -d ~/db/minikraken2_v1_8GB -t 8 -k 35 -l 150 #结束后会在kraken数据库路径下生成database150mers.kmer_distrib

Bracken参数解释:

  • -d,Kraken数据库路径;
  • -t,线程数;
  • -k,k-mer长度,Kraken1默认为31,Kraken2默认为32;
  • -l,reads读长。

数据库下载(第二种)

使用命令行下载Kraken数据库。

# 命令行下载数据库(需要时间长)
kraken2-build --standard --threads 56 --db kraken2_db # 标准模式下只下载古菌(archaea)、细菌(bacteria)、人类(human)、载体(UniVec_Core)、病毒(viral)

数据库下载(第三种)

下载序列后本地索引,较为灵活但下载时间较长。

mkdir kraken2_db && cd kraken2_db
# 先下载taxonomy
kraken2-build  --threads 56 --db ./ --download-taxonomy

# 然后下载所需类型数据库序列
# 可用数据库:"archaea", "bacteria", "plasmid", "viral", "human", "fungi", "plant", "protozoa", "nr", "nt", "UniVec", "UniVec_Core"
kraken2-build  --threads 56 --db ./  --download-library bacteria
kraken2-build  --threads 56 --db ./  --download-library viral
......

# 最后索引 
kraken2-build --build --threads 56 --db ./

补充说明:官方单独整理了一个真核病原菌的数据库,详情可参考EuPathDB

3. 分析

数据:质控好的PE150(如果为其它长度,Bracken数据库索引的长度也要改变)数据TEST.R1.clean.fq.gz和TEST.R2.clean.fq.gz。

# 第一步,使用Kraken2分析,不使用--use-mpa-style模式
mkdir out
~/bin/kraken2/kraken2 --db ~/dbminikraken2_v1_8GB  --threads 56  --report ./out/TEST.report --output out/TEST.output  --paired TEST.R1.clean.fq.gz TEST.R2.clean.fq.gz
# 第二步,使用Braken校正
~/software/Bracken/bracken -d ~/dbminikraken2_v1_8GB -i ./out/TEST.report -o ./out/TEST.S.bracken -w TEST.S.bracken.report -r 150 -l S
# 第三步,将Braken的report格式转换成--use-mpa-style格式
# 用Bracken的子程序
~/software/Bracken/kreport2mpa.py -r TEST.S.bracken.report   -o TEST.new.report
结果展示
TEST.new.report
KraKen2参数解释:
  • --db,数据库路径;
  • --threads,线程数;
  • --report,注释结果统计报告(每个物种的reads数目)文件名;
  • --output,每条reads注释详情输出文件名;
  • --paired,输入数据为paired-end数据。
Bracken参数解释
  • -d,Kraken2数据库路径(包含Braken对应长度索引);
  • -i,Kraken2的输出文件名(--report的输出文件名),在这里作为输入文件;
  • -o,Bracken输出文件(校正详情)文件名;
  • -w,Bracken计算后的新报告(每个物种的reads数目)文件名;
  • -r, reads长度;
  • -l,分类水平(D,P,C,O,F,G,S)。
kreport2mpa.py参数解释:
  • -r,需要转换的报告文件名;
  • -o,转换后的报告文件名(--use-mpa-style格式)。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,898评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,401评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,058评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,539评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,382评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,319评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,706评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,370评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,664评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,715评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,476评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,326评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,730评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,003评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,275评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,683评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,877评论 2 335