AF3Complex:基于AlphaFold 3的蛋白质复合物结构预测新突破

【字体: 时间:2025年08月01日 来源:Bioinformatics 5.4

编辑推荐:

  本研究针对蛋白质复合物结构预测精度不足的问题,通过改进AlphaFold 3的MSA生成算法、开发界面特异性评分指标pIS,并创新性地引入配体信息动态调控策略,构建了AF3Complex模型。该模型在1091个蛋白质复合物测试中DockQ评分显著优于AlphaFold 3(0.586 vs 0.573),尤其在抗体-抗原和蛋白-肽段相互作用预测中表现突出,为生物大分子相互作用研究提供了新工具。

  

蛋白质结构预测领域自AlphaFold 2问世以来迎来革命性突破,但蛋白质复合物(protein complexes)的精确建模仍是重大挑战。这类复合物在信号传导、免疫应答等生命过程中发挥核心作用,其界面残基的微小偏差可能导致完全不同的生物学功能。虽然AF2Complex等改进模型取得进展,但2024年发布的AlphaFold 3采用扩散模型架构(diffusion-based architecture)后,其复合物预测性能与专用模型的优劣尚不明确。

针对这一科学问题,美国佐治亚理工学院系统生物学研究中心(Center for the Study of Systems Biology, Georgia Institute of Technology)的Jonathan Feldman和Jeffrey Skolnick团队开发了AF3Complex模型。研究通过三项关键改进:取消配对多序列比对(paired MSA)、开发预测界面相似性评分(predicted Interface-Similarity score, pIS)、动态调控配体/离子信息输入,显著提升了复合物建模精度。相关成果发表于《Bioinformatics》。

关键技术方法包括:1)构建1091个非冗余蛋白质复合物测试集,采用40%序列相似性阈值聚类;2)基于AlphaFold 3架构开发pIS评分指标,专注界面残基评估;3)并行生成含/不含配体的预测结构并优选;4)使用DockQ、TM-score等指标系统评估抗体-抗原、蛋白-肽段等特殊复合物。

模型在蛋白质复合物数据集上的比较
在1091个复合物测试中,AF3Complex的DockQ中位数达0.722,显著高于AlphaFold 3的0.704(P=4.2×10-3)。排除低质量预测后,其TM-score提升至0.898,且73.5%的模型在配体信息动态调控策略下获得精度提升。

配体与离子数据的消融研究
当强制排除配体信息时,AF3Complex仍保持优势(DockQ中位数0.702 vs 0.686)。特别在72个自动排除配体的案例中,60%决策正确,小分子量复合物(<1000残基)更易受益于配体排除。

人类肽段数据集评估
在91个蛋白-肽段复合物测试中,AF3Complex的DockQ中位数达0.747,仅7个预测错误,其肽段界面建模能力显著优于AlphaFold 3(0.697)。

抗体-抗原数据集表现
针对SARS-CoV-2刺突蛋白RBD的36个抗体复合物(Gao数据集),AF3Complex平均DockQ为0.537;在更广泛的108个抗体-抗原复合物(Hitawala数据集)中仍保持0.441的精度,均优于基准模型。

CASP16竞赛蛋白测试
在9个CASP16竞赛蛋白预测中,AF3Complex的平均排名达4.2位,其中2个抗体-抗原复合物预测位列非人工干预模型第二。

该研究证实,通过针对性优化MSA处理策略和界面评估指标,能有效释放AlphaFold 3在复合物预测中的潜力。pIS评分对界面残基的特异性关注,弥补了传统ipTM评分(interface pTM)的不足;而配体信息的动态调控策略,则解决了小分子信息"双刃剑"效应。这些创新使AF3Complex成为目前最精确的复合物预测工具,尤其在抗体药物开发和肽段药物设计领域具有重要应用价值。未来研究可进一步探索该框架在膜蛋白复合物等挑战性体系中的适用性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号