基于深度学习的NMR约束辅助蛋白质结构预测新方法RASP及快速峰分配流程FAAST的开发与应用

【字体: 时间:2025年07月20日 来源:Communications Biology 5.2

编辑推荐:

  本研究针对NMR(核磁共振)谱图解析耗时耗力且传统结构预测模型与实验数据不一致的问题,开发了约束辅助结构预测模型RASP(Restraint Assisted Structure Predictor)和迭代式峰分配流程FAAST(Folding Assisted peak ASsignmenT)。通过直接整合实验约束信息,RASP显著提升了多结构域和低多序列比对(MSA)覆盖率蛋白的结构预测精度;FAAST将NOESY(核欧佛豪瑟效应谱)分析时间缩短至小时级,生成的结构集合与实验约束高度一致。该研究为实验数据与AI预测的协同优化提供了创新范式。

  

在结构生物学领域,精确解析蛋白质动态结构是药物设计的基石。核磁共振(NMR)作为能在溶液状态下测定蛋白质结构和弱相互作用的关键技术,其谱图解析却长期面临两大瓶颈:一是耗时数月甚至数年的峰归属过程需要高度专业化知识;二是深度学习预测模型如AlphaFold(AF2)生成的结构常与实验观测不符。这种实验与计算的割裂状态,严重制约了动态结构研究的效率与可靠性。

北京大学的研究团队在《Communications Biology》发表的研究中,创新性地提出了"实验-AI共生"解决方案。通过开发约束辅助结构预测模型RASP和迭代式峰分配流程FAAST,实现了实验约束信息与深度学习预测的闭环优化。该研究主要运用了四种关键技术:(1)基于AF2架构改进的RASP模型,通过MSA偏置和IPA偏置整合约束信息;(2)采用距离分布采样策略模拟实验约束;(3)构建包含490个样本的PSP验证数据集;(4)基于ARIA算法改进的CCVP(校准-边界计算-违例分析-峰分配)迭代协议。这些技术协同实现了从原始NMR数据到高精度结构的快速解析。

RASP模型性能验证方面,研究展示了三大突破性成果。在PSP验证集测试中,RASP仅需100个随机采样约束即可将TM-score从基线提高0.28,且约束召回率稳定在98%以上。特别值得注意的是,对于多结构域蛋白6XMV,RASP成功纠正了AF2预测的域间错误取向,使TM-score从0.51提升至0.79;对仅有3条MSA序列的病毒蛋白7NBV,50个约束使预测精度从0.43跃升至0.77。这些结果证实了约束信息对复杂蛋白结构预测的关键补充作用。

在NMR实验数据整合方面,研究团队通过对333个含.mr约束文件的PDB样本分析发现,RASP预测结构与实验约束的吻合度显著优于AF2:长程约束(序列间隔≥4)召回率中位数从81.0%提升至94.4%,接近PDB沉积结构的96.3%。这种提升在AlphaLink对比实验中同样显著,突显了RASP在实验数据整合方面的独特优势。

FAAST流程的测试结果更令人振奋。在57个ARTINA数据集样本上,该流程平均仅需32分钟即可完成分析,生成包含14.75个约束/残基的高质量结构集合。关键指标显示:预测结构与分配约束的吻合度达99.6%(长程99.0%),优于PDB沉积结构的98.6%;与参考结构的骨架RMSD中位数为0.739?,显著优于ARTINA报告的1.44?。特别在2MRM案例中,使用原始NOESY峰列表使约束数量提升2.9倍,验证了流程对原始数据的直接处理能力。

这项研究的创新价值体现在三个维度:方法论上,首次实现了NMR约束信息与深度学习架构的深度融合;技术上,RASP的柔性约束处理能力和FAAST的迭代优化机制形成了完整解决方案;应用上,为多结构域蛋白、动态构象等难题提供了新思路。正如作者指出,该框架可扩展至交联质谱等其他稀疏实验数据,为结构生物学研究开辟了"AI-实验"协同的新范式。未来通过整合更多约束类型(如二面角)和并行计算优化,这一平台有望成为结构解析的标准化工具。

研究团队特别强调,RASP模型不仅能提升预测精度,其pLDDT评分还可反向评估约束质量,这种双向反馈机制是传统方法无法实现的。这种"AI指导实验设计"的理念,或将重塑未来结构生物学的研究模式。正如补充实验所示,当故意引入50%错误约束时,TM-score会快速下降并与pLDDT保持0.89的相关性,证实了模型对约束质量的敏感判断能力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号