ARGs-OAP: 抗性基因在线分析工具

ARGs_OAP_v2.0(步骤1):https://github.com/biofuture/Ublastx_stageone
ARGs-OAP在线分析网站(步骤2): http://smile.hku.hk/SARGs

无处不在的抗性基因
图片.png

环境中抗生素抗性基因(ARGs)的来源:
随机突变或表达潜在抗性基因等方式使细菌体内基因组上存在的抗性基因原型、准抗性基因或潜在抗性基因被表达出来,从而使细菌获得的抗生素抗性。
抗生素在人和动物肠道内诱导产生耐药菌,这些编码ARGs的耐药菌经由粪便排出并进入环境中,是环境中ARGs的重要来源。
抗性基因的水平转移是抗性基因在环境中传播的的主要机制,通过将包含抗性基因的质粒、转座子、整合子作为载体,通过细菌之间细胞与细胞的接触,将抗性基因从载体细胞转移到受体细胞。

如何检测环境中抗生素抗性基因(ARGs):
  • PCR技术---定性。
  • qPCR技术---定量。
  • 宏基因组测序:以环境样品中的整个微生物群体基因组为研究对象,检测环境样本微生物中的物种组成、丰度,基因预测、基因丰度,利用数据库进行注释,得到样本中ARGs的种类和丰度与样本的相关性。
  • ARDB数据库:主要包含细菌病原菌的多种抗性基因数据,不能为环境样本宏基因组数据提供详细的ARG概况(即对每个检测到的ARG提供type/subtype的ARG分类信息和丰度信息)。
  • CARD数据库:以Antibiotic Resistance Ontology(ARO)为分类单位的形式所构建,ARO用于关联抗生素模块及其目标、抗性机制、基因变异等信息。
    ResFinder:需要较长的查询reads。对于在ResFinder中被检测为ARG的序列,其必须至少覆盖数据库中匹配ARG长度的五分之二,具有不小于50%的相似性。
  • ARGO:侧重于万古霉素和β-内酰胺抗性基因。
    ARG-ANNOT:设计用于检测细菌基因组中的ARG而不是环境样品。
构建ARG综合数据库SARG v1.0
  1. 整合CARD和ARDB数据库
    CARD数据库2,513条序列;
    ARDB数据库7,828条序列;
    去除586条共享序列;
    SARG包含4246条ARGs参考序列。
  2. 去除非ARG序列
  3. 去除冗余序列(完整蛋白质序列具有100%同一性)
  4. 去除与SNP相关的ARG序列
  5. 去除描述为“假定蛋白质”或“未命名蛋白质”的序列
  6. 构建结构化ARG数据库SARG
构建ARG综合数据库SARG v2.0
图片.png
  1. 使用SARG v1.0作为从NCBI-NR获取潜在ARG序列的种子。
  2. NCBI-NR序列BLASTP比对SARG v1.0数据库(e-value:1e-7, identity: 90%、80%、70%); levels: Accurate, Moderate and Loose 。
  3. 基于序列相似度或关键字匹配将ARG序列分配给不同的Subtype。
  4. 合并时,删除有多个分类结果的序列,只保留具有匹配分类(type和subtype)的序列。

Number of ARGs reference genes in core SARG database (column ‘core SARG’) and updated SARG database using different cut off of identity (90%, 80% and 70%) for retrieving. A is the profile before using parallel classification to seat each sequence into hierarchical structure. B is the results of sequences amount after being classified into specific ARGs types and subtypes.

ARGs-OAP概述

ARGs-OAP是一个抗生素抗性基因分析平台、在线分析工具。

ARGs-OAP可以从宏基因组数据集中快速鉴定并定量分析抗生素抗性基因。
ARGs-OAP中包含一个结构化ARG数据库SARG(type--subtype--reference sequence)。

ARGs-OAP 1.0版包括CARD及ARDB数据库的序列, 2.0版新纳入了NCBI-NR数据库中的ARG序列。

使用ARGs-OAP 进行注释后,对获得的ARGs:可以通过总reads数、16S rRNA基因拷贝数和细胞数量进行ARGs丰度标准化;2.0版优化了细胞数量定量分析过程。

ARGs-OAP在线工具使用步骤

1.本地计算机预先筛选潜在的ARG序列,以减少上传序列文件的大小;
2.使用在线平台注释/分类ARG序列。

对于宏基因组数据,快速预筛选可去除总序​​列> 99.3%的不相关序列,显着减少上传文件的大小并加速在线BLASTX分析。

步骤2:上传预筛选后的ARG序列数据至online pipeline。
ARGs_OAP_v2.0(步骤1):https://github.com/biofuture/Ublastx_stageone
ARGs-OAP在线分析网站(步骤2): http://smile.hku.hk/SARGs

The output files can be downloaded as tables listing the abundances of ARGs types/subtypes in different units:
“ppm” (number of ARGs sequences in one million sequences) ;
“copies of ARG per copy of 16S rRNA” ;
“copies of ARG per prokaryote’s cell” .

当数据集包含新ARG时(即数据集2):identity cutoff 设置为高于60%,则MCC值显著下降(图4a和4b),此水平下灵敏度也显著降低(图3d和4e),数据库的不完整性对注释精度影响不大(图4g和4h)。
E-value 对这三个评估指标的影响:MCC值和精度随着E-value的减小而增加,但灵敏度没有太大变化。
评估序列长度的影响:较长的读长导致较高的MCC和灵敏度(图3b和3c )。
最佳E-value 和 identity cutoff 值:与E值相比, identity值显示出更大的影响。蓝色箭头表示在以前ARGs注释( E-value为1e-5, identity为90%)中对短读数宏基因组数据进行分析时,MCC值和灵敏度较低假阴性率很高,并且错过了许多ARG样序列。为了揭示更全面的ARG概况,基于使用模拟数据集2所示的MCC结果,如红色箭头所示,建议的最佳identity cutoff 为60%,E-value为1e-7。

序列覆盖度小于85%时,灵敏度和MCC值几乎没有影响。
序列覆盖度从85%增加到100%时,灵敏度和MCC值急剧下降。
更严格的序列覆盖度会错过更多类似ARG的序列。

参考文献:
Yang Y, Jiang X, Chai B, et al. ARGs-OAP: online analysis pipeline for antibiotic resistance genes detection from metagenomic data using an integrated structured ARG-database[J]. Bioinformatics, 2016, 32(15):2346.
Yin X, Jiang X T, Chai B, et al. ARGs-OAP v2.0 with an Expanded SARG Database and Hidden Markov Models for Enhancement Characterization and Quantification of Antibiotic Resistance Genes in Environmental Metagenomes[J]. Bioinformatics, 2018.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容