
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CASP16中模型质量评估(MQA)的创新突破:多聚体组装体全局与局部精度评估及大规模模型筛选策略
【字体: 大 中 小 】 时间:2025年08月15日 来源:Proteins: Structure, Function, and Bioinformatics 2.8
编辑推荐:
这篇综述系统总结了CASP16(第16届蛋白质结构预测关键评估)中模型质量评估(MQA/EMA)领域的最新进展,重点分析了多聚体组装体的全局(QMODE1-SCORE/QSCORE)和局部(QMODE2)精度评估方法,以及从大规模模型库(MassiveFold)筛选最优模型的QMODE3挑战。文章通过五大顶尖团队(如MIEnsembles-Server、ModFOLDdock2等)的案例,揭示了共识方法(c)、准单模型方法(q)和单模型方法(s)的优劣,并探讨了AlphaFold2/3衍生特征(如pLDDT、ipTM)在评估中的关键作用,为结构生物信息学和下游应用提供了重要方法论参考。
CASP16的模型质量评估(MQA)类别聚焦于多聚体组装体的精度评估挑战,新增的QMODE3任务要求从MassiveFold生成的数千模型中筛选最优五个。研究揭示了MQA对结构预测者和实验者的双重价值,尤其关注界面残基评估和模型置信度判定的难点。
该团队开发的StrMQA方法整合了DMFold生成的参考模型结构相似性(TM-score/LDDT/DockQ)、模板比对特征和深度学习预测分数(如DeepAccNet的pLDDT)。在QMODE1中,其全局拓扑评估(SCORE)排名第一,但依赖参考模型质量的局限性在靶点T1249v1中暴露——错误构象因AlphaFold2默认排名缺陷被选为参考,导致评估失败。
通过三种变体(标准版、排名优化版、准单模型版)参与QMODE2评估。其核心创新包括:
OpenStructure工具计算QS/DockQ等9种共识分数
VoroIF-GNN预测界面CAD-score
神经网络架构优化局部界面残基评分(图2D)
尽管在靶点T1292o中实现近乎完美的QS-loss(0.005),但对T1218o的误判揭示了大规模模型筛选时链间碰撞检测的不足。
采用混合策略:
单模型评估:3D等变网络EnQA用于早期靶点(如H1204纳米抗体)
多模型共识:MMalign计算的PSS分数主导后期评估
在QMODE3中,其结合AlphaFold-Multimer置信度筛选和GCPNet-EMA几何评估的方法,使MULTICOM_LLM在同源多聚体评估中排名第一,但异源多聚体界面精度预测仍存短板。
DeepUMQA-X框架的创新点包括:
GraphCPLMQA2L:图耦合网络预测残基级plDDT
DeepUMQAS:分层网络架构评估pTM-score
轻量级界面比对策略提升大组装体评估效率
虽然局部界面评估(如T1206的lDDT)表现优异,但全局Oligo-GDTTS相关性(Pearson=0.643)逊于官方共识基线(AC)。
独辟蹊径采用统计力学思路:
8项物理化学参数(如原子重叠、氢键分布)
高分辨率晶体结构库(>1.4?)校准能量阈值
在QMODE3中,其简单加和策略使单体评估排名第三,但异源多聚体(11/24)表现暴露了未区分单体/多聚体参数库的缺陷。
共识方法(c)虽整体占优,但实际应用中常缺乏多样化模型库;准单模型方法(q)通过生成自有参考模型展现了替代潜力。AlphaFold3衍生的原子级pLDDT值(如不同原子差异评分)成为新兴评估维度,但纳米抗体等特殊靶点仍考验方法普适性。未来需开发动态构象评估框架,并整合预测工具的自我评估机制(如ipTM/pTM加权)以突破现有瓶颈。
生物通微信公众号
知名企业招聘