综述:机器学习预测从头蛋白质-蛋白质相互作用的趋势

【字体: 时间:2025年05月28日 来源:TRENDS IN Biotechnology 14.3

编辑推荐:

  这篇综述系统梳理了机器学习(ML)在蛋白质-蛋白质相互作用(PPI)预测领域的最新进展,重点聚焦于无进化痕迹的从头(de novo)相互作用预测技术。文章对比了基于共折叠(co-folding)的AlphaFold2(AF2)和表面特征学习(如MaSIF)等方法的优劣,并探讨了其在抗体-抗原复合物预测、分子胶(molecular glue)设计等生物技术中的应用潜力,为药物发现和蛋白质工程提供了新范式。

  

机器学习赋能从头蛋白质相互作用预测

De novo PPI预测的技术革新
蛋白质相互作用(PPI)是细胞功能调控的核心机制,而机器学习(ML)尤其是深度学习(DL)彻底改变了PPI预测领域。AlphaFold2(AF2)通过多序列比对(MSA)和共进化信号分析,能高精度预测具有进化痕迹的内源性PPI,但其在无先例可循的从头(de novo)相互作用(如抗体-抗原结合)中表现显著下降。这一局限性催生了三类创新方法:基于图神经网络的原子级模型(如EquiDock)、共折叠算法(如DockGPT)以及分子表面特征学习技术(如MaSIF)。

表面特征学习的突破性应用
分子表面相互作用指纹(MaSIF)通过测地线卷积神经网络,将蛋白质表面理化性质编码为旋转不变的“指纹”,实现了超高速互补表面搜索。其衍生工具MaSIF-seed成功设计了靶向PD-1/PD-L1和SARS-CoV-2包膜蛋白的从头结合剂。表面ID(SurfaceID)等自监督学习模型进一步扩展了该技术对分子胶诱导的“新表面”(neosurface)的预测能力,如实验验证的CRBN-E3连接酶三元复合物设计。

抗体与分子胶的精准预测挑战
抗体-抗原预测仍是领域难点,因互补决定区(CDR)环的构象灵活性和极性界面特性挑战现有算法。AF3虽引入扩散模型改进坐标预测,但对小极性界面(如分子胶介导的PPI)仍存在采样不足问题。近期DFMDock通过力场匹配框架将采样成功率提升至44%,而DiffMaSIf则证明表面扩散模型可有效建模动态结合过程。

生物技术应用的广阔前景
这些技术已推动多个应用场景:

  • 抗体工程:MaSIF-search可从数万候选结构中识别刚性靶标结合剂
  • 合成生物学:CAR-T细胞治疗中的受体设计依赖de novo PPI重编程
  • 靶向降解:分子胶降解剂(MGD)如来那度胺的理性设计成为可能
  • 生物传感器:特异性表位识别界面实现疾病标志物检测

未来展望
当前瓶颈在于极性界面和小接触面的预测精度。结合分子动力学(MD)模拟生成训练数据、开发混合表面/共折叠模型(如DeepRank-ESM整合语言模型嵌入),以及构建更全面的分子胶PPI数据库,将是突破方向。正如作者强调:“抽象内部折叠、聚焦驱动相互作用的关键表面特征”这一范式,有望实现从抗体到分子胶的一站式设计革命。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号