
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CASP16单体蛋白质结构预测评估:AlphaFold3的突破性进展与领域挑战
【字体: 大 中 小 】 时间:2025年08月20日 来源:Proteins: Structure, Function, and Bioinformatics 2.8
编辑推荐:
这篇综述系统评估了CASP16(蛋白质结构预测关键评估)中单体蛋白质结构预测的最新进展。研究指出AlphaFold3(AF3)在置信度估计和模型选择方面显著优于AlphaFold2(AF2),同时揭示了当前方法在截短序列、不规则二级结构预测等方面的局限性。文章重点分析了片段建模(fragment-based modeling)、多序列比对(MSA)优化等关键策略,并评估了Phase 0-2三个新挑战阶段的实验设计价值,为后AlphaFold时代的蛋白质结构预测发展提供了重要指导。
蛋白质结构预测领域的重要里程碑
ABSTRACT
CASP16实验评估表明,单结构域蛋白质折叠预测问题已基本解决——所有评估单元(EUs)中均未出现错误预测的折叠结构。然而在截短序列、不规则二级结构和相互作用诱导的构象变化预测方面仍存在挑战。AlphaFold3(AF3)在CASP16期间发布,其置信度估计和模型选择能力显著优于AlphaFold2(AF2)。多序列比对(MSA)优化和片段建模策略(选择完整序列的最佳片段进行建模)也提升了预测准确性。来自Yang实验室的三个团队在CASP16单体靶标预测中表现突出,反映了其稳健的建模流程和对AF3的成功应用。
1 引言
自1994年起,蛋白质结构预测关键评估(CASP)实验通过建立社区标准,推动着计算方法的进步。CASP14期间AlphaFold2(AF2)的突破性进展,为后续方法开发奠定了基础。CASP16开始时DeepMind发布了AF3网络服务器,多个预测团队将其整合到预测流程中。评估AF3是否代表领域新突破成为CASP16的重要任务。
CASP16引入了三个新挑战:Phase 0(隐藏化学计量信息)、Phase 2(每个靶标提供约8000个MassiveFold模型以测试模型选择策略)和Model 6(限制使用组织者提供的MSAs)。这些创新设计旨在推动领域发展。
2 结果与讨论
2.1 靶标与预测策略概览
125个人工专家组和36个服务器组提交了预测结果。目标蛋白质包括单体蛋白、同源/异源寡聚体蛋白复合物和蛋白质-核苷酸复合物。通过DomainParser等工具将蛋白质解析为结构域,定义评估单元(EUs)。热图分析显示,大多数EUs都能获得高质量模型,不同组间差异较小。
AF2和AF3仍是建模的金标准,约半数团队使用AF3。分析表明仅使用AF3或组合使用AF2/AF3优于仅使用AF2。定制化MSA(通常比AF默认MSA更深)也与更高预测准确度相关。值得注意的是,与CASP15不同,本次没有团队使用纯蛋白质语言模型(PLM)方法。
2.2 影响性能的EU特征
MSA深度(通过Neff衡量)与预测准确度呈正相关。原核蛋白通常能获得最深MSA,而真核和病毒蛋白MSA较浅。X射线晶体学解析的结构预测效果优于冷冻电镜结构,唯一NMR靶标T1226-D1预测效果最差。
从异源寡聚体和杂交复合物衍生的靶标通常比单体和同源寡聚体靶标更难预测。这可能与蛋白质在分子相互作用时发生的构象变化有关。
2.3 当前方法的潜在挑战
通过GDT_TS95(模型GDT_TS的95%分位数)与EU大小的关系,识别出多个具有挑战性的EUs:
截断导致的潜在构象变化:如病毒多蛋白衍生的T1207-D1,其C端截断可能导致实验观察到的构象变化,而当前方法对这种截断不敏感。
结合诱导的构象变化:如SPARDA复合物组分T1267s1-D1,其介导相互作用的环可能发生诱导契合,仅在寡聚体背景下才能正确预测。
不规则二级结构:如丝氨酸型整合酶SprA中的T1228-D3和T1228-D4,包含轻微弯曲的α螺旋,多数预测会错误预测为更长更直的螺旋。这可能与AF2/3训练数据偏向有序结构有关。
2.4 性能评估与排名
采用包含GDT_HA、QSE、reLLG_const等9个指标的综合评分体系。Phase 1排名中Yang实验室团队显著优于其他团队,主要优势在于GDT_HA和reLLG_const指标,但在MolProbity分数上表现较差。
基于所有阶段靶标的主排名显示,Yang实验室团队仍保持领先。其独特策略是通过去除潜在无序区域,使用片段(而非完整序列)作为AF2/3输入,这种片段建模策略显著提升了建模质量。
2.5 来自附加实验的启示
比较不同阶段表现发现,提供化学计量信息(Phase 1)和MassiveFold模型(Phase 2)帮助60%以上团队提升表现。典型案例包括:
MULTICOM团队通过分段建模获得病毒尾蛋白的正确伸直构象
KiharaLab在Phase 1正确预测HtrA丝氨酸蛋白酶六聚体构象
Wallner团队通过AFsample广泛采样正确预测挑战性靶标T1207-D1
Model 6评估显示部分团队(如Zheng、MULTICOM_human)的自定义MSA优于ColabFold提供MSA,而部分团队(如Guijunlab-QA)能在相同MSA下超越ColabFold。
2.6 质量评估
AF3服务器在第一模型评估中升至第二位,显示其在模型评估和排序能力的提升。PEZYFoldings团队以30/74的比例在首选模型选择中表现最佳。MassiveFold分析表明,CASP16团队的最佳模型通常优于MassiveFold最佳模型,但MassiveFold模型池包含部分靶标的更好模型,提示模型选择方法有待改进。
2.7 单体预测进展有限
与CASP15相比,CASP16的进展较为有限。通过匈牙利算法匹配靶标难度后,两届CASP的最佳表现无统计学显著差异(p=0.92)。加权bootstrap分析也证实这一结论。值得注意的是,更多团队在CASP16中超越了ColabFold表现,可能得益于AF3的应用。
2.8 结构域间相互作用评估
63-68对结构域间相互作用(DDIs)中,74%-79%被纳入同一EU,表明多数DDI能被准确建模。剩余DDI可能反映固有柔性或建模挑战。PISA分析显示仅少数跨EU DDI具有生物学意义,如T1218-D1/D2和D2/D3界面。
2.9 结论与展望
单结构域蛋白质结构预测已基本解决,但大分子、病毒蛋白和浅MSA目标仍具挑战。AF3在置信度估计方面表现优异,其全面发布可能带来新突破。建议未来CASP将Phase 0纳入核心评估,改进Phase 2设计以更好评估模型排序能力,并鼓励更多Model 6参与以独立评估MSA质量影响。
3 方法
详细描述了评估单元定义、热图生成、性能评估(含9个指标的综合评分体系)、质量评估等方法学细节。特别采用匈牙利算法和加权bootstrap技术进行CASP15-16的跨届比较,确保评估的客观性。
生物通微信公众号
知名企业招聘