AlphaFold-Metainference方法:基于深度学习的无序蛋白质结构集合预测新策略

【字体: 时间:2025年02月15日 来源:Nature Communications 14.7

编辑推荐:

  本研究针对深度学习方法在预测无序蛋白质结构集合中的挑战,开发了AlphaFold-Metainference方法,通过将AlphaFold预测的距离作为分子动力学模拟的结构约束,成功构建了有序和无序蛋白质的结构集合。研究验证了该方法在11种高度无序蛋白质和6种部分无序蛋白质(包括与ALS相关的TDP-43等疾病相关蛋白)中的准确性,为利用深度学习方法研究蛋白质动态特性提供了新思路,相关成果发表于《Nature Communications》。

  

在生命科学领域,蛋白质结构预测一直是极具挑战性的课题。随着AlphaFold等深度学习方法的突破,有序蛋白质的结构预测已达到实验精度水平,但无序蛋白质(IDPs)因其动态特性需要以结构集合形式表征,这成为当前研究的瓶颈。无序蛋白质在神经退行性疾病中扮演关键角色,如与肌萎缩侧索硬化症(ALS)相关的TDP-43蛋白、马查多-约瑟夫病相关的ataxin-3蛋白等,准确预测其结构集合对理解疾病机制至关重要。

英国剑桥大学的研究团队在《Nature Communications》发表研究,开发了AlphaFold-Metainference方法,创新性地将AlphaFold预测的距离信息作为分子动力学模拟的约束条件。该方法通过整合深度学习与物理模拟的优势,成功预测了从完全无序到部分无序蛋白质的结构集合,为蛋白质动态研究开辟了新途径。

研究主要采用三项关键技术:1)基于AlphaFold的残基间距离预测(distogram);2)元推断(metainference)框架下的分子动力学模拟,整合预测距离作为约束;3)小角X射线散射(SAXS)和核磁共振(NMR)数据验证。使用CALVADOS-2粗粒化模型提高采样效率,并通过PULCHRA重建全原子模型。

AlphaFold预测准确的残基间距离

研究发现AlphaFold能预测无序蛋白质的平均残基间距离,与SAXS实验数据高度一致(Kullback-Leibler距离DKL范围0.008-0.096)。对比分子动力学模拟生成的Aβ和α-synuclein结构集合,预测距离与模拟距离分布相关性良好,但限于22?以内。

高度无序结构集合的SAXS验证

对11种高度无序蛋白(如α-synuclein、tau等)的分析显示,AlphaFold-Metainference生成的结构集合其距离分布与SAXS数据吻合度(平均DKL=0.032)显著优于单独AlphaFold结构(DKL=0.582)。

部分无序结构集合的验证

在TDP-43、ataxin-3等含有序/无序混合区域的蛋白质中,该方法成功预测了折叠域(pLDDT>90)与无序区域(pLDDT<50)的协同构象。

与CALVADOS-2相比,AlphaFold-Metainference在4/6案例中表现更优,尤其在短程约束方面。

该研究证实,尽管AlphaFold训练集未包含无序蛋白质,但其预测的距离信息能有效反映无序蛋白质的物理相互作用特征。通过元推断框架整合预测与实验数据,首次实现了从单一序列同时预测有序和无序区域的结构集合。这一突破不仅扩展了深度学习在结构生物学中的应用边界,更为研究神经退行性疾病中蛋白质异常聚集机制提供了新工具。未来结合冷冻电镜(cryo-EM)等实验数据,有望进一步揭示蛋白质动态与疾病的关系。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号