基于AlphaFold2的蛋白质折叠路径快速预测:从序列到动态过程的新突破

《Nature Communications》:Rapid estimation of protein folding pathways from sequence alone using AlphaFold2

【字体: 时间:2025年12月02日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对AlphaFold2(AF2)能否揭示蛋白质折叠动态过程这一前沿问题,创新性地开发了一种不依赖多重序列比对(MSA)的迭代预测方法。研究人员通过系统分析7000余种蛋白质发现,AF2能够准确预测折叠中间态,揭示"局部优先、全局后成"的折叠机制,为理解蛋白质折叠原理提供了全新工具。

  
蛋白质是生命活动的执行者,其功能取决于独特的三维结构。然而,蛋白质如何从线性氨基酸序列快速折叠成特定空间结构,即"蛋白质折叠问题",一直是生命科学领域的重大挑战。虽然DeepMind开发的AlphaFold2(AF2)在蛋白质结构预测方面取得突破性进展,但静态结构预测是否等同于解决了蛋白质折叠的动态过程,仍是学界争论的焦点。
传统实验方法如核磁共振(NMR)和荧光共振能量转移(FRET)难以捕捉微秒级尺度的折叠中间态,而分子动力学(MD)模拟虽能提供原子级细节,却受限于力场精度和计算资源。这种困境促使研究者思考:AF2在学习结构预测的同时,是否也隐式掌握了蛋白质折叠的物理原理?
在此背景下,Liwei Chang和Alberto Perez团队在《Nature Communications》发表了创新性研究。他们巧妙地将AF2转化为折叠路径预测工具,通过摒弃多重序列比对(MSA)这一"捷径",迫使模型从单一序列出发探索整个能量景观。这种方法类似于从头预测(ab initio)方法,但速度提升数个量级,为大规模研究蛋白质折叠机制提供了可能。
关键技术方法
研究采用AF2模型进行迭代结构预测,不使用MSA或模板信息。对7418个PDB蛋白质进行大规模分析,通过设置不同循环次数(0-8次)和500次迭代,评估预测成功率。利用绝对接触序(ACO)、有效接触序(ECO)和长短程接触比等参数量化折叠路径。通过pLDDT评分系统评估预测置信度,并与实验测定的ψ值进行对比验证。
结果
MSA或模板有助于采样AF2学习的能量景观
研究发现,虽然MSA是导航AF2能量表面的有效方式,但并非唯一途径。通过单序列查询结合结构数据的生成器-判别器方法,AF2能够在不依赖进化信息的情况下区分结构质量。这种能力为探索折叠路径奠定了基础。
迭代采样AF2能量景观减缓结构预测速度,但能揭示折叠漏斗重要信息
研究团队开发了迭代预测策略:AF2从单序列查询预测结构,将该预测与序列查询结合进行下一轮迭代。这种方法放弃使用MSA,专注于检验AF2从单序列导航到天然状态的能力。循环和迭代步骤可独立或同时使用,直到结构预测及其置信度分数收敛。
AF2准确预测蛋白质折叠路径
对六种小蛋白质(蛋白质G、L及其突变体、泛素和SH3结构域)的迭代预测显示,生成的结构与实验已知的中间态甚至过渡态高度一致。pLDDT评分随着结构接近天然构象而增加,早期具有天然样区域的中间态呈现低pLDDT评分。
蛋白质G和L尽管序列相似性低且折叠路径不同,但共享共同拓扑结构。它们的突变体具有不同动力学特性,蛋白质G突变体甚至改变了野生型的折叠路径。AF2检测到的特定折叠中间态与先前实验和计算结果一致。
迭代结构预测遵循"局部优先、全局后成"折叠机制
研究发现六种蛋白质倾向于遵循"局部优先、全局后成"的折叠机制。通过绝对接触序(ACO)、有效接触序(ECO)和长短程接触比三个指标测量构象预测,发现初始迭代偏好局部接触,表现为低ACO和ECO分数。一旦接触建立,它将在序列上远离(高ACO)但在空间上接近(低ECO),减少构象搜索过程的熵损失。
ProteinMPNN生成的序列编码更平滑的能量景观
通过ProteinMPNN基于天然结构预测20个序列发现,设计序列比天然序列具有更优化的局部相互作用。对于大多数序列,AF2能够在几次迭代内预测与模板拓扑相似的结构,折叠漏斗足够平滑,AF2能够单次跳跃预测结构,未检测到潜在中间态。
将AF2迭代结构预测扩展到多样化蛋白质折叠
研究团队对PDB中7418个序列进行大规模迭代结构预测,蛋白质长度范围30-250个残基。成功预测率与蛋白质大小成反比:50个残基以下片段成功率约20%,而超过100个残基的蛋白质成功率迅速降至5%以下。
发现SH3、泛素样蛋白质及其他蛋白质的折叠中间态
研究发现,尽管SH3和泛素样蛋白质在结构嵌入中紧密聚集,但并非所有蛋白质都能准确预测。七个SH3样蛋白质似乎遵循与SH3蛋白质相同的折叠路径,其中中间三个β-片层首先堆叠在一起,等待N端和C端链之间相互作用的形成。泛素样蛋白质的预测也显示它们可能具有相似的折叠中间态。
AF2识别纤连蛋白III型结构域重复中的差异稳定性
对纤连蛋白(FN)III型(368个残基)的迭代结构预测显示,不同结构域的折叠存在显著差异:III7结构域快速找到天然结构,而III8和III10保持部分折叠,III9保持未折叠状态。这与实验研究一致,III9是四个重复中最不稳定的,平衡稳定性(△G)为-1.2(±0.5) kcal mol-1
讨论与结论
本研究通过创新性地操作AF2,证明了在没有MSA的情况下,AF2能够准确捕获实验观察到的蛋白质折叠中间态,更接近从头预测方法。AF2中的折叠路径似乎与"局部优先、全局后成"机制一致,首先折叠序列中邻近的残基对,然后在空间接近时锁定结构元件。
从技术角度看,这种使用AF2的方式既不是其设计目的(无MSA),也不是其预期用途(路径和折叠中间态)。超过7000种蛋白质的测试显示,AF2在较小蛋白质和具有更多二级结构的蛋白质上成功率更高。有趣的是,在学习预测蛋白质结构的过程中,AF2已经掌握了更深层次的蛋白质知识,使其能够以与已知发现兼容的方式折叠某些小蛋白质。
该研究的局限性在于中间态的瞬时性给实验表征带来挑战,目前缺乏单一指标来证明蛋白质折叠过程的预测准确性。然而,AF2-从头预测可作为生成中间态假设的宝贵工具,指导探针放置以实验验证或反驳这些假设。
这项研究不仅深化了我们对AF2所学蛋白质结构的理解,还开辟了利用机器学习模型模拟蛋白质折叠过程的新途径,为理解蛋白质折叠原理和设计新型蛋白质提供了重要工具。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号