NC | PRISM4基于微生物基因组序列预测次生代谢产物的结构和生物活性

文献信息

标题:Comprehensive prediction of secondary metabolite structure and biological activity from microbial genome sequences
中文:从微生物基因组序列中综合预测次生代谢产物的结构和生物活性
杂志:NC
时间:2020
单位:麦克马斯特大学

摘要

迫切需要新的抗生素来解决日益迫近的全球抗生素耐药性危机。历史上,临床使用抗生素的主要来源一直是微生物的次级代谢。微生物基因组测序揭示了大量未被发现的天然抗生素。把序列信息与编码分析的化学结构联系到一起的难阻碍了这些分子的提取。在这里,我们提供了PRISM 4,一个全面的预测基因组编码的抗生素化学结构的平台,包括目前临床使用的所有种类的细菌抗生素。化学结构预测的准确性使机器学习方法的发展能够预测编码分子潜在的生物活性。我们使用PRISM 4来绘制从培养分离菌和元基因组数据集收集的超过10,000个细菌基因组中的次生代谢产物生物合成图,揭示了数千种被基因编码的抗生素。
PRISM4网址:http://prism.adapsyn.com](http://prism.adapsyn.com/

Github:https://github.com/Adapsyn/prism-4-paper

一、基于细菌基因组预测次级代谢物化学结构


a PRISM 4的示意图概述。微生物基因组序列使用1,772 HMMs的库进行注释,次级代谢物BGCs使用基于规则的方法进行识别。利用618个虚拟裁剪反应库,实现了基于图的组合化学结构预测。
b 在PRISM 4中所包含的HMMs、虚拟裁剪反应、底物和糖的总数。
c PRISM4预测的新增次生代谢物家族化学结构举例。

二、PRISM4产生高精度化学结构预测

a BGCs手工黄金标准集(n = 1,281;由PRISM 4、antiSMASH 5和NP.searcher 鉴定。
b 每个程序预测的至少有一个结构的金标准集内的bgc的数量。
c 所有四个程序生成的至少一个预测结构的金标准BGCs子集的真结构和预测结构之间的中位数Tanimoto系数(n = 385)。
d 每个程序真结构和预测结构的官能团内容的d Jensen-Shannon散度。误差条显示bootstrap重采样的标准差。
e 中值和最大Tanimoto系数之间的真实和预测结构PRISM 4产生的金标准集,生物合成家族,并比较预测结构和非匹配的BGCs(“随机对”)之间的中值Tanimoto系数。第一,中位Tanimoto系数与随机Tanimoto系数比较有统计学意义(*p < 0.001; * p < 0.01;p < 0.05,双侧t检验)。底部是金标准集中每个家族的bgc数量(n)。盒图显示了中位数(水平线)、四分位范围(铰链)以及不超过1.5倍四分位范围(胡须)的最小值和最大值。

三、PRISM 4显示了3759个完整细菌基因组中次生代谢产物的生物合成。


a-b 在由生物合成科(a)和生产生物门(b)组成的3,759个被破坏的完整细菌基因组中,被PRISM 4、antiSMASH 5或这两种方法预测出至少一种化学结构的BGCs的数量,在基因组分类学数据库(GTDB)中被分类。
c-g 用PRISM 4和antiSMASH 5预测的产物从bgc中预测的n = 4220对次生代谢物的结构特征5空间的利平斯基法则中预测结构的c % 20。误差条表示样本比例的标准误差。
d 预测结构的分子量。预测结构的e Bertz拓扑复杂性指数21。
f 预测结构的内部多样性,用中位Tanimoto系数量化到集合中所有其他预测结构。
g 预测结构与已知天然产物的相似性,用中位Tanimoto系数量化到天然产物图谱中已知天然产物的集合。盒图显示了中间值(水平线)、四分位范围(铰链)、最小值和最大值不超过四分位范围(胡须)的1.5倍。源数据作为源数据文件提供。

四、定量预测结构-活性关系(QPSAR)模型揭示了数千种基因组编码抗生素。


a 用于支持向量机(SVM)模型的接收器工作特性(ROC)曲线在生物合成基因簇或棱镜预测结构的化学指纹中发现的Pfam域上训练。
b 分布bgc预测生产次生代谢产物的抗菌、抗肿瘤、免疫调节、抗真菌、抗病毒、多个或没有生物活动10121年集合完成或metagenome-assembled原核基因组,通过生物合成的家庭(左)或生产生物门(右),在基因组分类法分类数据库(GTDB) 。
cd 用一致流形近似和投影(UMAP)可视化预测结构化学空间,生物活性(c)或基因组起源(d)着色。
e 相对于完整的细菌基因组,根据元基因组组装基因组(MAGs)中预测的生物活性对次生代谢产物的富集或消耗。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容