2024年CASP基础设施升级:多类别结构预测评估与CAPRI系统整合的技术突破

【字体: 时间:2025年09月03日 来源:Proteins: Structure, Function, and Bioinformatics 2.8

编辑推荐:

  本文系统综述了2024年CASP(蛋白质结构预测关键评估)基础设施的重大升级,涵盖RNA/DNA结构、多聚体复合物、配体结合等9大建模类别,并首次实现与CAPRI(预测相互作用关键评估)系统的深度整合。通过优化评估流程(如LDDT-PLI、BiSyRMSD等20项指标)和数据处理能力(如OpenStructure 2.8应用),为计算结构生物学领域提供了标准化技术框架。

  

1 引言

CASP作为计算结构生物学的标杆性实验,已从单一蛋白质结构评估拓展至RNA、DNA、多聚体复合物等9大建模领域。2024年CASP16的创新性体现在:首次引入化学计量比预测(Phase 0)、大规模预计算模型集(MassiveFold)辅助建模,以及溶剂空间分布等前沿挑战。UC Davis的CASP中心通过PostgreSQL数据库和CGI脚本构建的动态系统,实现了从靶标发布到模型评估的全流程自动化。

2 CASP系统升级

2.1 既有类别的评估优化

RNA靶标:采用LDDT、TM-score等5项核心指标,新增RNA特异性INF网络评分(如INF_WC评估沃森-克里克相互作用)。CASP16处理35个RNA靶标(较CASP15增长3倍),通过OpenStructure 2.8实现多链RNA(如R1251)的自动化评估。

配体-蛋白质复合物:优化LDDT-PLI评分以消除非天然接触干扰,新增制药公司数据集(如罗氏L1000系列233个复合物)。评估显示,结合位点局部叠加的BiSyRMSD对药物设计更具指导意义。

2.2 新类别的技术实现

化学计量比预测:30个蛋白质多聚体采用两阶段发布(Phase 0无计量信息→Phase 1明确计量),通过目标编号(如T0206→T1206)区分评估阶段。结果揭示,预知计量比可使模型准确率提升18%。

核酸结构:DNA单体(D1273)首次纳入评估,采用RNA同类指标(如TM-align),但受限于ClaRNA软件无法计算INF评分。杂交复合物(如M1268)则整合蛋白质与核酸链的命名规则(A/B链→0/1链)。

配体亲和力:140个复合物分两阶段评估,绝对亲和力(Kd)与相对亲和力并行提交。有趣的是,结构辅助阶段的预测准确率较盲测阶段提高32%。

3 CAPRI与CASP系统整合

通过PDBe/EMBL-EBI服务器实现双向数据流:CAPRI参与者注册CASP ID后,前5名模型自动同步至CASP评估。联合实验(如Round 57)中,MassiveFold模型与CAPRI提交的100个模型经匿名化后进入评分集。CAPRI特有的界面中心评估(如Fnat、iRMS指标)与CASP的全结构评估形成互补,为蛋白质-蛋白质相互作用研究提供多维视角。

4 技术挑战与解决方案

大数据处理:制药数据集(如L3000系列)单次提交超千个模型,通过独立网关(predictions_submission_LG.cgi)分流避免服务器阻塞。

评估标准化:半无序系统(T1200)采用NMR RDC数据验证,而RNA溶剂壳(R1260)通过冷冻电镜密度图评估水分子分布,两者均需定制化分析流程。

5 展望

CASP16首次实现跨实验平台(CAPRI)和多模态数据(冷冻电镜/SAXS)的整合评估,为AlphaFold时代的结构预测设立了新基准。未来将重点开发自动化错误反馈系统,以应对大规模数据挑战。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号