浅谈人工智能在药物设计和发现中的应用进展

机器学习(Machine Learning,ML)属于人工智能的子领域,它是研究机器能够熟练执行智能任务的过程和实用性,而无需为这些任务明确编程。最近,人工智能系统已经接近人类在一些任务上的表现,如游戏和图像识别,但这些是在非常狭窄和集中的领域。尽管如此,人工智能的各种形式如今已成功地应用于大范围的领域:从机器人、语音翻译和图像分析,再到药物分子设计的应用。

在药物发现中,最好的人工智能不一定是能够自主设计一种新药的单一人工智能,而是一种或多种不同的人工智能,能够在整个药物发现过程中更好地理解和设计新的输入,从靶点选择、命中识别、引导优化到临床前研究,最后到临床试验。

人工智能在药物发现中能起着关键作用,特别是人工神经网络,如深度神经网络或循环网络,驱动着这一领域的发展。在性质或活性预测方面的许多应用,如物理化学和ADMET性质,定量结构-性质关系(QSPR)或定量结构-活性关系(QSAR)等技术支撑着这方面的应用。人工智能推动生物活性分子朝着期望的特性发展,结合合成计划和易合成的可行性,计算机自动发现药物的可能性越来越大。

人工智能包括机器学习等技术是为学习和预测新特性建立的,尤其是人工神经网络,如深度神经网络(deep neural netwroks, DNNs)或递归神经网络(recurrent neural networks, RNNs),推动了人工智能的发展。

自20世纪60年代以来,药物化学就开始使用人工智能应用于新化合物的设计,其中有标记训练数据集的训练模型被广泛应用于分子设计中。定量构效关系(QSAR)方法广泛用于预测化学结构的性质,如logp、溶解度和生物活性。相反,不依赖于标签的无监督机器学习也在医学和化学中使用,例如层次聚类、算法和主成分分析等用于分析大分子库。

药物化学研究中,当深度学习体系结构在性能预测方面显示出好结果时,新型人工智能技术受到了广泛关注。在Merck Kaggle和NIH Tox21挑战中,与基础机器学习方法相比,深度神经网络显示出更好的预测性。

在药物发现中,临床候选化合物分子必须满足一组不同的标准。除了对生物靶的有效效力外,该化合物应对不针对的靶标具有相当的选择性,并且具有良好的物理化学和ADMET特性(吸收、分布、代谢、排泄和毒性特性)。因此,化合物优化是一个多维度的挑战。在多维优化过程中,采用了大量的硅预测方法,特别是一些机器学习技术已经被成功应用,例如支持向量机器(support vector machines, SVM)、随机森林(Random Forests, RF)或贝叶斯学习。

在没有参考化合物时,从头设计开发新的活性分子需要约25年。由于人工智能领域的发展,从头设计化合物最近出现有一些新的进展。一种有趣的方法是变分自动编码器,它由两个神经网络、编码器网络和解码器网络组成。编码器网络将由SMILES表示定义的化学结构转换为一个实值连续向量作为潜在空间。解码器能将来自该潜在空间的矢量转换为化学结构。

这一特性被用于寻找潜在空间的最优解决方案,并通过解码网络将这些向量反向转化为真实分子结构。对于大多数反编译,一个分子占主导地位,但存在细微的结构修改的可能性较小。使用潜在空间代表来训练基于QED药物相似性评分和合成可及性评分SAS的模型。可以得到一条具有改进目标性质的分子路径。在另一份文章中,将这种变分自动编码器的性能与对抗性自动编码器进行了比较。对抗式自动编码器由产生新型化学结构的生成模型组成。

人工智能近年来备受关注,并已成功进入药物发现领域。许多机器学习方法,如QSAR方法、SVMs或随机森林法,都是药物发现过程中建立起来的。基于神经网络的新算法,如深度神经网络,为属性预测提供了进一步的改进,这在许多比较深学习与经典机器学习的基准研究中已经显现出来。这些新算法在许多不同应用中的适用性已经得到证明,包括物理化学性质、生物活性和毒性等。

多任务学习的一些好处也得到了证明,其中相关属性的预测受益于联合学习。未来的改进可以通过学习一种适应当前化学的代表性问题来实现。首先,我们已经努力从这些问题中识别相关的化学特征,也指出了这些算法的一个主要挑战,即它们的“黑匣子”特征。从深层神经网络中提取某些化合物是非常困难的,如果人工智能越来越多地引导合成这些资源,这就变得很相关了。

人工智能在药物发现中的应用得益于开源实现,它提供了对软件库的访问,允许实现复杂的神经网络。因此,像TensorFlow或Keras这样的开放源码库经常被用于在药物发现中实现不同的神经网络结构。此外,Deepchem库提供了一个围绕TensorFlow的包装器,它简化了化学结构的处理。

近年来,人工智能系统的应用范围大大扩大,包括从头设计或逆合成分析,预示我们将在有大型数据集可用的领域看到越来越多的应用。随着在这些不同领域的进展,我们可以预料到越来越多的计算机将用于自动药物发现。尤其是机器人技术的巨大进步将加速这一进展。然而,人工智能还远未达到完美。具有良好理论背景的其他技术仍然很重要。特别是,由于它们受益于计算能力的提高,因此可以用更精确的方法模拟更大的系统。

作者:曾文亮

分子描述符和分子指纹

分子描述符/指纹计算软件

结构预处理和数据预处理

算法简单介绍和分类

KNIME软件介绍

基于sklearn的特征选择

模型的评价与解释

ADMET介绍

KNIME软件构建ADMET模型

ADMET计算软件和实操

噪声过滤和相似性搜索

机器学习模型构建和预测

分子对接

ADMET评估

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容