Science | 基于AI预测的蛋白质相互作用网络
原创 风不止步 图灵基因 2021-12-30 09:07
收录于话题#前沿生物大数据分析
撰文:风不止步
IF=47.728
推荐度:⭐⭐⭐⭐⭐
亮点:
生物传感器条形码提供一种可扩展的方法来扩展多路复用能力,以破译信号网络的复杂性及其细胞之间的相互作用。
2021年12月9日,巴塞尔大学的 Torsten Schwede教授等人在《Science》上发表了一篇“Interactomes in the era of deep learning”的文章,文章表明深度学习提供了酵母蛋白交互组的原子快照,表征大分子的相互作用可以更好地理解细胞的内部运作。然而,今天所有可用的方法都有局限性。一些方法告诉我们两个大分子是否相互作用,另一些方法则提供关于相互作用伙伴的原子细节,或者最多只能提供没有细胞背景的孤立组合体的结构。
Humphreys等人描述了一种新的计算方法,它建立在结构生物信息学中正在进行的深度学习革命之上,可以同时预测蛋白质-蛋白质相互作用的组成和三维(3D)结构的模型。将他们的方法应用于真核系统--面包酵母(Saccharomyces cerevisiae)--并预测和准确模拟了超过1500种蛋白质-蛋白质相互作用,其中106种是以前没有见过的,为整个细胞的高通量、高精确度建模铺平了道路。
确定大分子的三维结构及其相互作用提供了有关大分子机制的重要信息,例如可用于药物开发或在生物技术中加以利用。实验性结构生物学方法,如大分子晶体学(MX)和高分辨率冷冻电子显微镜(cryo-EM)提供了大分子结构及其组装的原子级细节。这样的实验是费力的,需要将大分子从其细胞环境中提纯出来。尽管诸如酵母双杂交(Y2H)和交联质谱(XL-MS)等技术可以大规模检测相互作用的伙伴,但诸如定点诱变或福斯特能量共振转移(FRET)实验等方法可以描述单个相互作用和界面的特征。这些信息可以用来指导组合体的建模,例如,综合方法中的大分子对接,该方法将来自低分辨率实验的各种数据类型与计算建模相结合,生成大分子组合体的三维表示。
近年来,结构生物学的视野被结构预测的计算技术大幅拓展,机器学习算法的发展以及开放数据库中实验信息的迅速增加。自1994年以来,结构预测关键评估(CASP)实验为测试蛋白质结构预测方法提供了一个平台,在其历史上,经历了几次革命。例如,检测远程同源关系的敏感方法的发展促进了基于同源关系的建模,而协同进化信息的使用进一步改善了没有已知结构同源物的蛋白质的建模。后一种方法是基于空间上接近的残基在进化上是耦合的,从多序列排列中提取的耦合信号可用于预测三维的紧密接触。这不仅被证明对预测蛋白质的三维结构是有用的,而且也很容易扩展到分子间相互作用的领域,作为一种快速和准确的方法来筛选和预测蛋白质相互作用对,例如,在细菌(大肠杆菌)的蛋白质组中。
结构生物信息学的一个新时代开始了。DeepMind的AlphaFold2算法成为第一个在CASP中对单个蛋白质结构达到接近实验的原子精度的计算方法。这一成功的基础是将最先进的深度学习方法与大量的计算能力和过去五十年来积累的大量结构和序列数据结合使用。RoseTTAFold作为AlphaFold2的一个密切的学术竞争者很快崛起。这两种方法都使用了最先进的深度学习方法,但在其核心架构上有所不同。不过,两者的一个重要部分是使用来自多序列比对的进化耦合,在其基础网络中有效地处理这些耦合,以预测原子间的接触,并从氨基酸序列中准确计算出目标蛋白质中原子的三维坐标。鉴于以前这种信号在识别蛋白质-蛋白质相互作用方面的成功,探索这种方法来改善蛋白质-蛋白质相互作用及其在原子水平上的组装的预测和建模是有意义的。
尽管大多数努力集中在调整AlphaFold2和RoseTTAFold工作流程,以模拟已知成分和化学计量的蛋白质复合物,Humphreys等人将RoseTTAFold的接触预测算法的速度与AlphaFold2的折叠引擎的高精确度相结合提出了一种新方法,以准确预测和同时模拟整个面包酵母蛋白质组的蛋白质对,这是第一个以这种高通量方式建模的真核生物。扫描了大约800万个假定的蛋白质对。Humphreys等人根据强烈的共同进化信号预测了那些更有可能发生相互作用的蛋白对,并通过对联合蛋白对的蛋白质结构预测来取代大分子对接,从而为组合的三维结构建模。该方法能够准确地预测1500多个相互作用对的组成和结构模型,这些相互作用对几乎跨越了所有关键的真核细胞过程,包括106个未描述的组合,可能突出了以前未知的过程,以及600多个以前已知的相互作用对(根据低分辨率的生物物理数据)。
汉弗莱斯等人的工作是向高分辨率的整个细胞建模迈进了一步,并且已经激发了对人类线粒体相互作用组的进一步研究。目前,诸如MX和电子显微镜(EM)等方法提供了高分辨率的大分子机器的原子图。孤立的大分子机器的高分辨率原子表示:细胞低温电子断层扫描(cryo-ET)有可能提供大分子相互作用网络的详细快照,但到目前为止只能获得亚纳米级的分辨率。基于人工智能(AI)的高度精确的蛋白质组范围内的相互作用建模可能能够及时弥补这一分辨率的差距,特别是对于更复杂的生物体。尽管如此,AlphaFold2和RoseTTAFold等方法提供了一个静态模型,将大分子组装的瞬时和动态性质纳入其中将需要在未来解决。
这项工作还强调了开放科学和基于社区的方法开发的成功。由一家商业公司开发的AlphaFold2被公开提供给整个社区,包括其源代码。这促进了不同目标的基于人工智能的生物信息学方法的快速发展,如Humphreys等人的研究。基于人工智能的方法显然促进了未来生命科学研究方式的转变,在这种情况下,三维计算模型将经常激发新的可实验测试的假设。
教授介绍
Torsten Schwede 教授
自2018年以来-巴塞尔大学研究副校长
自2018年以来-巴塞尔大学 Biozentrum 结构生物信息学教授
2016年-2019年SPHN数据协调中心和BioMedIT 项目主任,SIB瑞士生物信息学研究所
入选奖项及荣誉:2009年ISI汤森路透选择了“SWISS-MODEL:自动蛋白质同源建模服务器;Nucleic AcidsRes 31: 3381-3385 (2003)”是过去10年(1999-2009)中被引用次数最多的瑞士论文。
2014年在一项研究“Best of: Schweizer Forschung 2014/15”中,SNSF瑞士国家科学基金会将传统引文与替代指标进行了比较,2014年关于SWISS-MODEL的核酸研究手稿在传统影响测量方面排名第6。
参考文献
Joana Pereira,Torsten Schwede. Interactomes inthe era of deep learning.(2021)