CASP16中模型质量评估(MQA)的创新突破:多聚体组装体全局与局部精度评估及大规模模型筛选策略

【字体: 时间:2025年08月15日 来源:Proteins: Structure, Function, and Bioinformatics 2.8

编辑推荐:

  这篇综述系统总结了CASP16(第16届蛋白质结构预测关键评估)中模型质量评估(MQA/EMA)领域的最新进展,重点分析了多聚体组装体的全局(QMODE1-SCORE/QSCORE)和局部(QMODE2)精度评估方法,以及从大规模模型库(MassiveFold)筛选最优模型的QMODE3挑战。文章通过五大顶尖团队(如MIEnsembles-Server、ModFOLDdock2等)的案例,揭示了共识方法(c)、准单模型方法(q)和单模型方法(s)的优劣,并探讨了AlphaFold2/3衍生特征(如pLDDT、ipTM)在评估中的关键作用,为结构生物信息学和下游应用提供了重要方法论参考。

  

1 引言

CASP16的模型质量评估(MQA)类别聚焦于多聚体组装体的精度评估挑战,新增的QMODE3任务要求从MassiveFold生成的数千模型中筛选最优五个。研究揭示了MQA对结构预测者和实验者的双重价值,尤其关注界面残基评估和模型置信度判定的难点。

2 结果

2.1 MIEnsembles-Server方法

该团队开发的StrMQA方法整合了DMFold生成的参考模型结构相似性(TM-score/LDDT/DockQ)、模板比对特征和深度学习预测分数(如DeepAccNet的pLDDT)。在QMODE1中,其全局拓扑评估(SCORE)排名第一,但依赖参考模型质量的局限性在靶点T1249v1中暴露——错误构象因AlphaFold2默认排名缺陷被选为参考,导致评估失败。

2.2 ModFOLDdock2方法

通过三种变体(标准版、排名优化版、准单模型版)参与QMODE2评估。其核心创新包括:

  • OpenStructure工具计算QS/DockQ等9种共识分数

  • VoroIF-GNN预测界面CAD-score

  • 神经网络架构优化局部界面残基评分(图2D)

    尽管在靶点T1292o中实现近乎完美的QS-loss(0.005),但对T1218o的误判揭示了大规模模型筛选时链间碰撞检测的不足。

2.3 MULTICOM方法

采用混合策略:

  • 单模型评估:3D等变网络EnQA用于早期靶点(如H1204纳米抗体)

  • 多模型共识:MMalign计算的PSS分数主导后期评估

    在QMODE3中,其结合AlphaFold-Multimer置信度筛选和GCPNet-EMA几何评估的方法,使MULTICOM_LLM在同源多聚体评估中排名第一,但异源多聚体界面精度预测仍存短板。

2.4 GuijunLab方法

DeepUMQA-X框架的创新点包括:

  • GraphCPLMQA2L:图耦合网络预测残基级plDDT

  • DeepUMQAS:分层网络架构评估pTM-score

  • 轻量级界面比对策略提升大组装体评估效率

    虽然局部界面评估(如T1206的lDDT)表现优异,但全局Oligo-GDTTS相关性(Pearson=0.643)逊于官方共识基线(AC)。

2.5 Shortle方法

独辟蹊径采用统计力学思路:

  • 8项物理化学参数(如原子重叠、氢键分布)

  • 高分辨率晶体结构库(>1.4?)校准能量阈值

    在QMODE3中,其简单加和策略使单体评估排名第三,但异源多聚体(11/24)表现暴露了未区分单体/多聚体参数库的缺陷。

3 启示与挑战

共识方法(c)虽整体占优,但实际应用中常缺乏多样化模型库;准单模型方法(q)通过生成自有参考模型展现了替代潜力。AlphaFold3衍生的原子级pLDDT值(如不同原子差异评分)成为新兴评估维度,但纳米抗体等特殊靶点仍考验方法普适性。未来需开发动态构象评估框架,并整合预测工具的自我评估机制(如ipTM/pTM加权)以突破现有瓶颈。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号