FoldBench:全原子生物分子结构预测的综合基准测试揭示模型性能与泛化能力
《Nature Communications》:Benchmarking all-atom biomolecular structure prediction with FoldBench
【字体:
大
中
小
】
时间:2025年12月05日
来源:Nature Communications 15.7
编辑推荐:
准确预测生物分子复合物结构是理解生命过程和理性药物设计的基础。为解决现有基准测试在覆盖范围与评估标准上的不足,研究人员开展了名为FoldBench的全原子生物分子结构预测基准研究。该研究构建了包含1,522个生物组装的跨领域基准数据集,系统评估了AlphaFold 3等五种前沿模型的九大预测任务性能。结果显示AlphaFold 3在多数任务中领先,但抗体-抗原预测失败率超50%,且模型性能显著受配体相似度和训练数据记忆效应影响。该基准为未来模型开发提供了关键评估标准和改进方向。
在结构生物学领域,准确预测生物分子复合物的三维结构如同破解生命语言的密码,对理解疾病机制和开发创新药物具有革命性意义。近年来,深度学习技术推动该领域取得突破性进展,特别是AlphaFold 3的出现,将预测范围从单一蛋白质扩展到蛋白质、核酸、配体、离子等多元生物分子体系。然而,这片繁荣图景背后隐藏着严峻挑战:不同模型的性能缺乏统一标准衡量,针对特定分子类型的预测可靠性存疑,更重要的是,模型对训练数据的依赖程度及其真实泛化能力始终成谜。正如航海家需要精确的海图,科研界亟需一个能全面评估这些"分子预言家"真实能力的基准平台。
为解决这一瓶颈,复旦大学许昇、冯千泰等研究人员在《Nature Communications》发表了题为《FoldBench:全原子生物分子结构预测基准测试》的重要研究。团队构建了包含1,522个生物组装的跨领域基准数据集FoldBench,涵盖九类预测任务,系统评估了AlphaFold 3、Boltz-1、Chai-1、HelixFold 3和Protenix五种前沿模型。研究揭示:AlphaFold 3在多数任务中表现领先,但抗体-抗原复合物预测失败率超50%;模型性能与配体相似度呈正相关,凸显训练数据记忆效应;核酸结构预测仍是行业难点。该基准为未来模型开发提供了关键评估标准和改进方向。
关键技术方法包括:基于PDB数据库(蛋白质数据库)的生物组装筛选流程,采用序列相似性<40%和结构相似性TM-score<0.5的低同源性过滤标准;使用5×5采样策略(5种子×5样本)配合10轮循环的构象空间探索方案;依托OpenStructure(开放结构)框架的DockQ(对接质量分数)、LDDT(局部距离差异测试)、LRMSD(配体均方根偏差)等多维度评估体系。
通过558个蛋白-配体复合物分析发现,AlphaFold 3以64.9%的成功率领先,但在"未见配体"场景下性能下降。配体相似度与预测精度呈强正相关(图3F),例如ATP类似物ADP的变构位点预测中,仅AlphaFold 3产生少量正确构象(图3H)。研究表明蛋白结构预测精度(LDDT-LP>0.8)并非主要瓶颈,配体相似度才是决定性因素。
在279个低同源性蛋白-蛋白界面测试中,AlphaFold 3的DockQ成功率达72.9%。异源复合物表现优于同源复合物(图4C),与早期研究相反。典型案例8DPA(图4D)显示AlphaFold 3能准确预测结构域交换同源二聚体,而其他模型均失败,证明其对构象变化的捕捉能力。
172个抗体-抗原对测试揭示该任务是最大挑战:AlphaFold 3成功率仅47.9%,其他模型失败率超60%。增加采样量可提升性能(图5B),但需配合精准排序算法。CDR H3环(互补决定区H3环)建模精度与DockQ得分高度相关(图5C),纳米抗体因结构简单更易预测(成功率53.3%)。
核酸单体预测平均LDDT仅0.2-0.6,显著低于蛋白质(0.88)。长链RNA(如7ZJ4)和G四链体(如8UTG)预测失败(图6B,D),蛋白-DNA界面成功率(79.2%)高于蛋白-RNA(62.3%),反映DNA结构规整性优势和RNA数据稀缺劣势。
研究结论指出,当前模型在数据丰富场景表现良好,但在抗体-抗原界面、变构位点、核酸等关键领域存在明显局限。性能差异受训练数据分布、分子复杂性、排序算法可靠性共同影响。FoldBench的建立为领域发展提供三方面支撑:统一评估标准助力公平比较,故障模式分析指明改进方向,数据共享机制促进算法迭代。未来需聚焦训练数据扩容、构象采样优化、排序算法创新等方向,特别是加强对抗体柔性区域和核酸复杂结构的学习能力。这项研究不仅绘制了全原子结构预测的"能力地图",更为解锁更难生物医学靶点的结构密码铺设了基石。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号