导读
今天给大家介绍一篇 2023 年发表在 Journal of Chemical Information and Modeling 上的文章, 标题为:《Rational Prediction of PROTAC-Compatible Protein–Protein Interfaces by Molecular Docking》。
作者提出了一种基于分子对接的方法,旨在高效且准确地预测与 PROTAC 兼容的蛋白-蛋白相互作用界面。PROTAC 是一种异功能配体,可介导蛋白靶标与 E3 连接酶的相互作用,目前正在药物开发中展现出潜力,尤其是在针对癌症的临床试验方面。
该研究团队描述了一种计算效率高、通用的方法。该方法结合了基于约束的对接、基于能量的重评分和基于最小溶剂可及表面距离的筛选,适用于未知 PROTAC 配体的 PROTAC 兼容蛋白质-蛋白质相互作用(PPI)。在对一个包含 13 个三元复合物晶体结构的手动策划数据集进行基准测试时,该方法从结合结构出发的准确率达到 92%,从未结合结构出发的准确率达到 77%。该方法仅需提供 E3 连接酶和靶蛋白的单体形式的配体结合结构,因而具有通用性、准确性和高效性,对于早期阶段的 PROTAC 基药物设计活动尤为重要,特别是在三元复合物结构信息不可用的情况下。
数据集选择与整理
选择标准
从 PDB Bank 中提取了 13 个 PROTAC 三元复合物晶体结构。选择依据包括:
- 包含 E3 连接酶、配体分子和靶标。
- 晶体结构分辨率低于 4 Å。
- 配体为 PROTAC 而非分子粘合剂。
数据集组成
数据集包括:
- 三种类型的 E3 连接酶:9 个 VHL,2 个 Cereblon 和 2 个 cIAP。
- 各种 PROTAC 分子。
- 多样化的蛋白质靶标,从激酶到溴结构域,以及参与 DNA 修复的蛋白质。
对接准备
准备工作包括使用 VMD 的 psfgen 工具封顶蛋白末端,标准化残基名称,并去除氢原子。这对于真实的对接场景至关重要,其中未结合的单体在界面侧链堆积方面与初始晶体结构有所不同。
分子对接
LightDock 框架
使用 LightDock 的 0.9.2 版本进行了对接实验。LightDock 以其使用萤火虫群优化算法而闻名,该算法通过刚体平移和旋转优化对接构象,使其朝向能量上更有利的方向。
灵活性与对接精度
- 由于可能增加噪声和计算成本,未使用各向异性网络模型(ANM)。
- 对接实验主要是刚体的,避免了采样侧链构型空间的巨大计算需求。
精炼与重新评分
- 使用 VoroMQA 对构象进行重新评分,以确保协议的准确性。
- 筛选标准包括几何中心距离以及锚定原子之间 SASD 的存在和长度。
对接实验
探索了两种场景:
- 重对接(或已结合)对接。
- 现实(未结合)对接。
在两种场景中,都强制执行接触残基约束以指导对接过程。
评估对接精度
使用 CAPRI 标准和 DockQ 分数评估了对接协议的准确性,重点关注保守的天然接触分数和 RMSD 值等指标。基于这些标准确定可接受的解决方案。
AlphaFold-Multimer 结构预测
- 使用 AlphaFold2-multimer 预测蛋白质-蛋白质复合物。
- 使用与 LightDock 相同的指标评估这些预测的准确性。
PROTAC-Model 基准计算
该研究还将其结果与 PROTACModel 的结果进行了比较,使用两项研究中共有的系统。这一比较对于验证方法论及其在计算化学中的应用至关重要。
主要结果及图表
作者通过引入接触残基约束,提高了蛋白质-蛋白质相互作用(PPI)预测的准确性,同时保持了方法的通用性。
- 🧪 引导对接算法的接触残基约束
- 📊 数据显示,相比无约束对接,约束对接更准确
- 🔬 实际对接实验准确度较低,但可通过筛选和重评分得到提升
研究者在 13 个 PROTAC 介导的复合物上进行了重对接实验。认为如果生成至少一个可接受的解决方案,即为对接成功。考虑到文献中关于三元复合体灵活性的报告,无偏见的对接算法准确预测这些界面颇具挑战。为此,作者引入了接触残基约束,并在方法部分详细介绍了此约束的选择方法。这一策略确保对接算法专注于 PPI,同时保持协议的通用性和适用性。
重对接实验表明,在无指导算法的情况下,对接模拟通常无法生成可接受的构象。然而,加入接触残基约束后,对于最佳 20 个构象的队列,准确度显著提高(分别为 77%,69%,54%,采用 4, 6, 和 8 Å 接触残基约束)。
此外,通过 VoroMQA 能量重评分后,准确度有显著提高。在实际的对接实验中,尽管准确度从 77%降至 23%,但通过重评分和筛选,准确度提升至 46%。
研究者还引入了溶剂可及表面距离(SASD)滤波器,进一步提升了协议性能,准确度由 46%增至 77%。剔除无法为特定系统生成有效解决方案的实验后,发现协议在最佳 10 和 20 个构象的准确度分别为 82%和 91%。若仅考虑 CRBN 和 VHL 配体,这一准确度分别上升至 89%和 100%。
图 1: PROTAC 介导的复合物结构分析
- (A) PROTAC 配体 dBET6(绿色)介导的 6BOY 复合物晶体结构,展现连接酶 cereblon(CRBN,橙色)与溴结构域靶标 BRD4(蓝色)的结合。
- (B) 在 6BOY 结构中,以 CRBN 配体的质心(绿色)为中心,选取不同半径范围内的表面残基,作为对接约束条件(橙色)。
- (C) 进行了带有接触残基约束的重对接计算。
- (D) 采用 VoroMQA 能量函数,对重对接计算结果进行了重新评分。
图 2: PROTAC 基准数据集的真实对接实验
- (A) dBet6 PROTAC 配体(绿色)与 E3 连接酶(橙色)及溴结构域靶标(蓝色)之间的 COG-COG 欧几里得距离(灰色)描述,PDB 编号为 6BOY。
- (B) 展示了两配体间最短 SASD 路径(灰色)。
- (C) 进行了带接触残基约束的真实对接精度分析。
- (D) 采用 VoroMQA 方法重新评分后的真实对接精度。在底部两个面板中,对每组顶级结构(top 1、5、10、20、50 或 100)的质量进行了分析,以确定其是否至少达到可接受水平,根据 CAPRI 分类或 DockQ 得分。
图 3: SASD 筛选后的真实对接精度与重新评分
- (A) 对接精度在采用 COG-COG 欧几里得距离或 Jwalk 计算的 SASD 筛选前后的对比。
- (B) 总结了最佳方案的性能。第一栏展示了性能最佳的设置,包括 VoroMQA 能量重评分和 SASD 筛选(深绿色)。成功案例指的是在前 200 个预测结构中,至少有一个被对接引擎认为可接受的解决方案(浅橙色),共计 13 个中的 11 个。最后一栏(深棕色)突出了包含 CRBN 或 VHL 连接酶的成功案例协议性能,共计 11 个中的 9 个。
- (C) 展示了使用该工作流程获得的最佳预测(排名第一)与 6BOY 晶体结构(灰色)的对比。
- (D) 展示了使用该工作流程获得的最佳预测(排名第三)与 6HAX 晶体结构(灰色)的对比。
- (E) 展示了使用该工作流程获得的最佳预测(排名第六)与 6W8I 晶体结构(灰色)的对比。
结论
本研究描述了基于 LightDock 的 PROTAC 药物设计新协议,其以高效准确为特点,在复合体结构预测上展现至少可接受的质量。
- 🧬 结合使用基于约束的 LightDock 模拟和 VoroMQA 的能量重评分
- 🔄 Jwalk 的 SASD 计算为复合体结构预测提供支持
- 🎯 该协议适用于任何 E3 泛素连接酶/靶标配对,速度快、准确率高
- 📊 在对 PROTAC 介导的三元复合体数据集进行基准测试时,重对接和现实对接实验的准确率分别为 92%和 77%
- 🌐 若未知 PROTAC 分子与特定配对结合,该方法能提供初始配置,快速推进 PROTAC 药物设计
- ⚖️ 与 PROTAC-Model 等先进方法相比,本方法在准确度和计算效率之间取得平衡
创新与价值
- 该研究提出了一种新颖的计算工作流程,用于通过分子对接预测与 PROTAC 兼容的蛋白质-蛋白质相互作用(PPIs)。
- 提供了一种新方法,结合基于约束的对接、基于能量的重打分和溶剂可及表面距离过滤,解决了早期 PROTAC 基础药物设计中的一项挑战。
缺点:
- 数据集和验证问题
- 用于基准测试的数据集虽经策划,但可能无法代表现实场景中蛋白质靶标和连接酶的多样性。
- 验证主要侧重于准确性指标,但可能在评估预测 PPIs 的生物学相关性方面缺乏深度。
- 与现有方法的比较
- 与现有方法的比较有限,使得难以评估相比当前最先进方法的进步。
- 研究缺乏关于该方法与现有 PROTAC 设计计算工具的比较或改进方面的详细讨论。
- 局限性
- 提及的局限性,如缺乏结构精炼步骤和对接过程中需要包含配体,未得到充分探讨或解决。
改进建议
扩展数据集和验证
- 使用更多样化的蛋白质集进行基准测试,以更好地代表现实世界场景。
- 引入额外的验证指标或生物学相关性测试,以加强预测的实际应用性。
全面的比较分析
进行与现有方法更全面的比较,可能包括领域内几种更突出的方法论,以获得更清晰的背景理解。
提供关于此方法与其他方法相比的优势和劣势的详细讨论,包括计算效率、准确性和易用性等方面。
解决局限性问题
- 探讨并讨论克服所提及局限性的潜在方法,例如在工作流程中加入结构精炼步骤。
- 扩大关于方法普适性的讨论,可能通过使用更广泛的连接酶和靶标进行测试,以展示其更广泛的适用性。
参考资料:
Pereira, G. P., Jiménez-García, B., Pellarin, R., Launay, G., Wu, S., Martin, J., & Souza, P. C. T. (2023). Rational Prediction of PROTAC-Compatible Protein–Protein Interfaces by Molecular Docking. Journal of Chemical Information and Modeling, 63(21), 6823–6833.
DOI: https://doi.org/10.1021/acs.jcim.3c01154
Data and code: https://github.com/GilbertoPPereira/PROTACability
PDF Download: https://is.gd/JM4xV0