一文看懂病原微生物检测(下篇)

作者:biofan
审稿:童蒙
编辑:amethyst

一文看懂病原微生物检测(上篇)介绍了样本采集、实验建库及测序的相关内容,这篇让小编带领大家了解一下病原微生物检测的信息分析流程。

信息分析流程

一般而言,mNGS的成功除了严格的实验条件之外呢,还需要严格的信息分析的流程。基本步骤如下:
1.数据质控
2.去除人基因组
3.与数据库比对,鉴定病原微生物
4.生成报告

01 数据质控

数据质控主要包括去除低质量的reads,去除adapter等等,可以用fastp(https://github.com/opengene/fastp)来快速实现数据质控。

02 去除人源污染

由于测序数据中,人源背景占据90% 以上,为了排除人源序列的干扰,所以一般质控之后必须去除人的基因组(如IDseq用多种比对方式去除人的基因组)。

而不同的软件去除人的基因组的比例也有所不同,比如IDseq统计结果(如下图)。

03 鉴定病原微生物

构建病原数据库
鉴定病原微生物的核心是要构建病原微生物的库。一般而言,数据库往往从NCBI进行下载并加以整理。

  • NR/NT数据库

NR(Non-Redundant Protein Sequence Database)是非冗余蛋白库,包含所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据库中的序列号。NR库相当于一个以核酸序列为基础的交叉索引,将核酸数据和蛋白数据联系起来。

NT(Nucleotide Sequence Database)是核酸序列数据库,是NR库的子集,NT,NR 数据库可通过ftp://ftp.ncbi.nih.gov/blast/db/FASTA/ 这个链接进行下载整理。

  • RefSeq数据库

RefSeq数据库是参考序列数据库,包含RefSeq_genomic(NCBI genomic reference sequences),RefSeq_protein(NCBI protein reference sequences)和RefSeq transpans(NCBI transpans reference sequences),是具有生物意义上的非冗余基因、转录本和蛋白质序列,是经过NCBI和其他组织校正的数据库。RefSeq数据库可通过ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/ 这个链接进行下载整理。

  • Taxonomy物种库

Taxonomy是NCBI的分类数据库,包括大约7万余个物种的名字和种系,这些物种至少在遗传数据库中有一条核酸或蛋白序列。其目的是为序列数据库建立一个一致的种系发生分类学,可从https://ftp.ncbi.nih.gov/pub/taxonomy/ 这个链接进行下载整理。

而关于taxdump文件夹里有相应的readme,对每个文件进行了细致的描述。此外网上一篇文章也进行了详细阐述https://blog.csdn.net/u011262253/article/details/95304930

如果是自己动手搭建流程的话,就可以根据不同的比对软件,构建相应的索引啦。

微生物鉴定分析软件
目前包含建库、质控、比对以及出具报告的比较全面软件有OneCodex,Sunbeam,SUPRI 和IDSeq。OneCodex,Sunbeam是需要付费。非流程性的快速检测的软件包括kraken,pathseq,kaiju等等。

我们选择其中几个,介绍一下。
SURPI
SURPI提供比较老2014年的代码,在Github开源(https://github.com/chiulab/SURPI-plus-dist),但建议大家不要尝试,因为当你费劲千辛万苦装完了一系列的的依赖,安装完相应的库后,你会发现流程可执行性很差,以过来人的身份建议还是莫要轻易尝试,很容易竹篮打水一场空,而SURPI最新版本需要付费订阅。


IDSeq
IDseq流程目前属于开源的状态。可以通过Github 进行下载。
IDSeq提供的资源有:

Kraken
kraken软件在不断更新,2014年发布kraken1,2018年发布krakenUniq以及2019年发表了kraken2。kraken是一款速度比较快,准确度较高,安装极为方便的软件。kraken2可从Github 下载安装 (https://github.com/DerrickWood/kraken2)。

Kraken2软件安装即为简单,只需如下命令:

sh install_kraken2.sh ${install_path}
Kraken2构建数据库也很方便,根据不同参数利用kraken2-build即可完成数据库下载和建立索引工作(例如以下命令):
kraken2-build --standard --db $DBNAME
kraken2-build --build --db $DBNAME

kraken检测病原体可以输入fasta或fastq文件。
kraken2 --db $DBNAME seqs.fa
kraken2 --paired --classified-out cseqs#.fq seqs_1.fq seqs_2.fq

最后输出样本的物种注释信息(如下):
C @SRR1106119.1.1 1 2697049 29903 2697049:15

结果共5列:
第一列 "C"/"U":是序列的分类(C:分类;U:未分类);第二列是reads的ID号;第三列是taxonomy ID;第四列和第五列分别是测序reads长度以及kmer的LCA映射。

04 报告生成

检测报告一般需要涵盖病毒、细菌、真菌以及寄生虫检出序列条数,以及覆盖度等信息。

如果mNGS 检测报告中提示某种 / 某些微生物检出序列数较高、基因组覆盖度高,表示检测到该病原微生物 ; 在排除背景菌、污染菌和定植菌的情况下,可以考虑该微生物是致病病原体,可以结合患者的临床特征、当地细菌耐药的流行病学协助指导抗菌药物的选择。

结语

以上便是对病原微生物的简单介绍,希望大家能从背景、临床实验以及信息分析流程对病原微生物检测有一定的了解。后续我们会持续介绍的,请大家多多关注。

参考文献

  1. IDseq—An open source cloud-based pipeline and analysis service for metagenomic pathogen detection and monitoring
  2. A cloud-compatible bioinformatics pipeline for ultrarapid pathogen identification from next-generation sequencing of clinical samples
  3. Improved metagenomic analysis with Kraken 2
  4. 宏基因组分析和诊断技术在急危重症感染应用的专家共识
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,898评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,401评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,058评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,539评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,382评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,319评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,706评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,370评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,664评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,715评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,476评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,326评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,730评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,003评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,275评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,683评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,877评论 2 335

推荐阅读更多精彩内容