AlphaFold2与分子动力学优化在蛋白质-蛋白质界面分子对接评估中的突破性研究

【字体: 时间:2025年09月27日 来源:Journal of Cheminformatics 5.7

编辑推荐:

  本研究针对蛋白质-蛋白质相互作用(PPI)调制中分子对接方法的性能评估问题,系统比较了AlphaFold2(AF2)预测模型与实验结构在对接中的表现。通过对16个具有验证调节剂的PPI数据集进行八种对接协议的基准测试,发现AF2模型与天然结构性能相当,局部对接策略优于盲对接,且分子动力学(MD)和AlphaFlow生成的构象集成能提升对接效果。该研究为AF2结构在PPI靶向虚拟筛选中的应用提供了重要依据,并强调了改进当前评分方法的迫切需求。

  
在药物发现领域,结构为基础的分子对接技术扮演着关键角色,它能够预测蛋白质与配体之间的结合模式和亲和力,从而加速合理药物设计进程。然而,对接策略在预测结合亲和力和处理蛋白质灵活性方面存在明显不足,这些限制在设计蛋白质-蛋白质相互作用(PPI,Protein-Protein Interaction)调节剂时尤为突出。与传统的酶或受体靶点不同,PPI具有大而平坦的接触表面,且结构数据有限,因此成为具有挑战性的治疗靶点。尽管如此,由于PPI在重要生物过程中的核心作用,它们仍然是治疗癌症、神经退行性疾病和感染性疾病的潜在靶点。
近年来,对接协议的进步显著增强了PPI调制领域的发展,其中AlphaFold2(AF2)和分子动力学(MD)优化发挥了关键作用。先前的研究评估了多种对接算法在使用实验结构识别真实结合化合物方面的效果,并随后证明了同源建模和从头预测模型的实用性。AF2的出现使得即使在缺乏同源模板的情况下也能预测高分辨率蛋白质结构,但关于AF2模型在PPI对接中的适用性尚未有系统性的基准研究。
为了填补这一空白,Jordi Gomez Borrego和Marc Torrent Burgas在《Journal of Cheminformatics》上发表了一项研究,旨在评估AF2模型与实验解析结构在针对PPI的对接协议中的表现。研究人员使用一个包含16个相互作用及其已验证调节剂的数据集,对八种对接协议进行了基准测试,揭示了天然结构与AF2模型之间的相似性能。局部对接策略优于盲对接,其中TankBind_local和Glide在测试的结构类型中提供了最佳结果。MD模拟和其他集成生成算法(如AlphaFlow)对天然和AF2模型进行了细化,改善了对接受果,但在不同构象间表现出显著变异性。这些结果表明,虽然结构细化在某些情况下可以增强对接效果,但整体性能似乎受到评分函数和对接方法限制的约束。尽管蛋白质集成可以改进虚拟筛选,但预测最有效的对接构象仍然是一个挑战。
本研究的主要技术方法包括:1)从ChEMBL和2P2Idb数据库筛选16个具有已知活性配体的PPI复合物;2)生成AF2模型(包括基于天然PDB结构的AFnat和基于全长的AFfull);3)通过500 ns全原子MD模拟和AlphaFlow生成构象集成;4)应用八种对接策略(Glide、Glide-IFD、Vina、Gnina、TankBind_local、TankBind_blind、EquiBind和DiffDock)进行对接评估;5)使用AUROC(Area Under Receiver Operating Characteristic Curve)、AUPRC(Area Under Precision-Recall Curve)和EF1%(Enrichment Factor at 1%)等指标评估性能。
研究结果显示,AF2模型作为分子对接的起始结构具有适用性。所有AFnat模型的ipTM+pTM评分均高于0.7,属于高质量模型,且TM-score中位数为0.972,DockQ中位数为0.838,表明与实验结构在拓扑和链取向方面高度相似。然而,AFfull模型的质量普遍较低,主要是由于未折叠或改变区域导致的预测平均误差(PAE, Predicted Average Error)较高。这表明在预测蛋白质复合物时,尤其是下游应用如分子对接中,应考虑未折叠区域的负面影响。
在构象集成作为对接起始结构方面,MD模拟显示,16个复合物中的11个属于稳定结构类别,代表结构在整个模拟过程中与初始配置密切相似,反映了复合物的稳定性。而重新排列的结构类别主要包括蛋白质-肽复合物,其中蛋白质伴侣相对稳定,但肽表现出高灵活性,显著影响DockQ和界面均方根偏差(iRMS, Interface Root Mean Square Deviation)指标。AlphaFlow集成表现出与MD模拟相似的RMSF(Root Mean Square Fluctuation)模式,但波动增加,且能量分布更广,表明其能够捕获构象灵活性并生成MD模拟中通常未观察到的构象。
对接性能评估显示,局部对接策略中,使用PDB或AFnat结构在AUROC值上没有显著差异。协议的整体AUROC值适中,中位数从AutoDock Vina的0.522到TankBind_local的0.623不等。使用Glide-IFD协议并未显著增强性能,可能是由于核心界面残基的灵活性有限(通常只有三个残基)。MD模拟和AlphaFlow通过细化蛋白质动力学(包括侧链构象和环重排)带来了所有策略的AUROC值的 modest 改进,其中Glide和Gnina的增益显著。盲对接方法中,TankBind_blind在处理肽结构和某些蛋白质时遇到困难,因为结合口袋未被检测到。EquiBind和DiffDock一致地识别出至少一个口袋用于配体定位,但配体在大型蛋白质中不一致地放置在蛋白质界面处,通常分散在溶剂暴露的表面斑块上。许多配体表现出立体冲突且缺乏物理合理性,这与最近研究报告的深度学习盲对接方法产生的结构不合理姿势一致。
在结合口袋分析中,高度可药物化的靶点(如1YCR、5FMK和6EPL,Dscore>0.75且SiteScore接近或高于0.8)倾向于产生更强的早期富集,而具有低或中等Dscore的靶点(如1E50、2B4J、2P8Q、4FTG和8AQN)则倾向于具有较差的早期检索性能。然而,未观察到口袋描述符与对接性能之间的强相关性,可能是由于分析的PPI数量相对有限。
综上所述,本研究通过系统评估AF2模型、MD优化和构象集成在PPI分子对接中的应用,揭示了当前对接策略的整体性能 modest,且AF2模型与天然结构在对接性能上无显著差异。局部对接协议如Glide和TankBind_local表现出比盲对接方法更高的判别能力, refinement 通过MD或AlphaFlow可以显著改善虚拟筛选协议的性能,但不同构象间的AUROC值高变异性表明主链或侧链构象的局部重排会严重影响对接性能。预测哪种构象将产生最佳结果仍然具有挑战性。这些发现支持在PPI靶向对接协议中使用AF2生成的结构,并强调了改进当前评分方法的必要性。未来的研究应关注于开发更精确的评分函数和集成基于构象的方法,以更好地利用新兴的结构预测工具。
研究结论强调,PPI在细胞中扮演关键调节角色,是具有前景但具有挑战性的治疗靶点。尽管当前对接策略的表现普遍 modest,但AF2模型在蛋白质结构不可用时可作为有希望的替代方案。结构细化通过MD模拟或AlphaFlow可以改善虚拟筛选性能,但局部重排的影响使预测最佳构象变得困难。局部对接协议相比盲对接方法表现出更高的判别能力,而盲对接的性能下降可能源于不准确的结合位点预测、立体冲突和物理不合理的姿势。这些结果为未来针对PPI的虚拟筛选建立了参考框架,并强调需要改进评分函数和基于集成的方法以更好地利用新兴结构预测工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号