基于AlphaFold2生成扩散模型UFConf的迭代结构扩散建模(IMSD)探索变质蛋白折叠转换路径
【字体:
大
中
小
】
时间:2025年09月26日
来源:Proteins: Structure, Function, and Bioinformatics 2.8
编辑推荐:
本综述创新性地提出IMSD(迭代结构扩散建模)方法,结合生成扩散模型UFConf(基于AlphaFold2网络)探索变质蛋白(MPs)折叠转换机制。该方法通过迭代“加噪-去噪”过程成功模拟了GA98、SA1 V90T和RfaH-CTD等蛋白的构象转换路径,揭示了双漏斗能量景观特征。IMSD为研究蛋白质动力学提供了高效计算工具,克服了传统分子动力学(MD)模拟的时间尺度限制,对理解蛋白质功能多样性和设计新型蛋白质具有重要意义。
蛋白质科学长期遵循"序列-结构-功能"范式,认为蛋白质序列唯一决定其三维结构,进而决定功能。然而,内在无序蛋白(IDPs)和变质蛋白(MPs)的发现突破了这一传统认知。变质蛋白能够采用两种或更多截然不同的空间结构,在功能调控中发挥重要作用。尽管实验研究表明蛋白质数据库中高达4%的蛋白质可能具有折叠转换特性,但由于替代态通常种群稀少,直接实验观测面临巨大挑战。
计算工具成为研究变质蛋白的重要手段。分子动力学(MD)模拟虽然能提供原子级分辨率,但折叠转换过程的时间尺度远超常规MD模拟能力。增强采样方法如副本交换等部分解决了这一问题,但仍存在计算成本高的问题。AlphaFold2(AF2)作为革命性的机器学习工具,在预测蛋白质结构方面取得突破,但对变质蛋白替代态的预测能力有限。
生成扩散模型(GDMs)的最新发展为蛋白质结构预测带来了新机遇。这类算法通过前向扩散(加噪)和反向扩散(去噪)过程生成蛋白质结构。UFConf是基于改进AlphaFold2网络的生成扩散算法,能够从氨基酸水平重建蛋白质结构。研究表明UFConf能成功预测多种蛋白质构象重排,包括膜转运蛋白、多域丝状蛋白和激酶等。
2.1 UFConf单次运行能否预测两种变质折叠?
研究首先测试了UFConf在单次运行中预测六种典型变质蛋白两种折叠状态的能力。设置扩散时间参数t=1.0,使程序从完全随机的氨基酸空间分布开始生成结构,仅依靠序列信息而避免对起始结构的偏向。
以GA98为例,该蛋白是通过合理设计获得的变质蛋白,98%序列同源的GA98和GB98分别保持3α折叠和4β+α折叠。UFConf运行生成100个副本结构,计算每个副本与参考结构(GS和AS)的骨架均方根偏差(rmsd)。结果显示UFConf成功复现了GA98的GS折叠(3α),但未能恢复AS折叠(4β+α)。然而,它生成了一些更接近AS而非GS的副本,这些副本呈现出AS折叠中初生的β-片层结构特征。
其他变质蛋白的测试结果类似:SA1、XCL1、Mad2和分离的RfaH-C端结构域生成的副本都倾向于GS折叠,同时显示出一系列不同程度偏离GS模型的物种。唯一例外是全长的RfaH,UFConf同时恢复了其开放构象(C端结构域采用5β折叠,对应低种群AS状态)和封闭构象(C端结构域转变为α-螺旋发夹,类似主要GS状态)。
研究表明,UFConf通常能恢复变质蛋白的基态,但无法预测其替代态。然而,它生成了大量处于GS向AS过渡路径上的构象物种,这些可解释为折叠转换中间体。
研究者开发了基于UFConf的IMSD(通过结构扩散进行迭代建模)协议来模拟变质蛋白从一种折叠到另一种折叠的路径。该方法从状态A的实验结构开始,通过加噪过程扰动该结构,然后通过反向扩散过程推断新的结构模型。从这批模型中,选择最接近替代状态B的模型作为迭代最小值(IM),以其为起点进行下一轮加噪/去噪,生成新一批副本,如此迭代进行。
在GA98从3α折叠到4β+α折叠的IMSD模拟中,采用自适应调整策略:当当前IM与AS之间的rmsd低于5?时,将t从0.5降至0.4;当rmsd进一步低于3?时,将t降至0.3;当rmsd达到2?时终止模拟。
模拟结果显示,从GS模型开始的仿真最终到达了与AS模型相差2?以内的状态,成功实现了折叠转换。轨迹呈现特征性的回旋镖形状,与双漏斗能量景观中折叠转换过渡的增强MD模拟结果一致。轨迹分析揭示了关键转换事件:早期α3螺旋的溶解,随后β3-β4发夹的形成和α2螺旋的扩展,接着N端β1-β2发夹结构的成核,最终形成与AS状态相似的完整β-片层。
重复轨迹和反向过渡(从AS到GS)的模拟都证实了关键转换事件的顺序和可重复性。这些结果与实验数据高度一致:二级结构预测器(AGADIR、Jpred4、PSSPred)均表明α3区域螺旋性低但具有相当β-片层倾向性;突变Φ分析表明GA88的全螺旋折叠由α1和α2螺旋中的残基簇支撑;GB1蛋白的实验研究也证实β3-β4发夹是折叠核的一部分,而边缘链β2是β-片层的最后添加部分。
2.3 SA1 V90T折叠转换过渡的IMSD建模
SA1是基于嗜热菌S6核糖体蛋白的人工设计变质蛋白,其11-66位残基被GA结构域的56个残基序列替换。该嵌合构建体具有采用两种不同折叠的潜力:S6核糖体蛋白天然的α/β折叠或GA序列编码的全α折叠。SA1 V90T单点突变揭示了替代态的存在,使得能够在HSQC谱中观察到GS和AS物种的混合物。
IMSD模拟需要针对SA1 V90T进行特殊调整。初始尝试使用t=0.5未能成功,后改用t=1.0有效驱动蛋白质脱离"GS阱"。此外,由于AS模型具有长的无序尾巴,在精炼阶段将rmsd计算限制在AS的结构部分(残基15-80),显著改善了AS附近的收敛性。
模拟结果显示,初始使用t=1.0时,UFConf仅基于序列信息构建结构模型,所有这些模型都与GS相似,但已开始出现差异:β4链在IM1中就已丢失。随后20次迭代中观察到剩余β-片层的逐渐恶化,β结构完全丢失后又在IM24-IM27中短暂重建,随后β3位置开始形成新的α螺旋(按AS命名法为α3),最终形成全螺旋排列。
最终在IM41中形成了具有正确拓扑结构的三螺旋束α1-α2-α3,与AS模型一致。经过15轮额外精炼后,系统到达IM56,与AS折叠非常相似,其中α4相对于AS模型保持倾斜,可能比AS模型更好地代表了替代态。
2.4 分离的RfaH-CTD折叠转换过渡的IMSD建模
细菌转录抗终止蛋白RfaH由两个结构域组成,在自由状态下采用自动抑制的封闭构象,CTD以αα-发夹形式与NTD包装。当RfaH与ops暂停的RNA聚合酶结合后,CTD从NTD解离并迅速重折叠为β-桶,转化后的CTD与核糖体结合,启动新合成RNA的现场翻译。
分离两个结构域通过蛋白酶切导致CTD转换为β-桶形式,当作为单独构建体表达时,RfaH-CTD采用β-桶构象。两种折叠(β-桶和αα-发夹)都编码在RfaH-CTD序列中,域间相互作用简单地使后者优于前者。
IMSD模拟使用相同的默认协议,从GS模型开始逐渐远离基态:到IM11时丢失了边缘链β4,相邻链β3变短;几次迭代后,原始β-桶排列中仅存短的β2-β3片段,拓扑结构变为扭曲发夹;从IM14到IM15拓扑结构进一步改变,后者没有可识别的二级结构,但可见α2螺旋的成核(残基137-145)和α1的成核(残基121-127)。
从几乎无结构的IM15开始,系统开始重折叠为替代构象,轨迹转向下移动,减少与AS模型的rmsd。IM16中观察到部分形成的αα-发夹,背面带有β1-β5配对,这种称为βααβ单元的安排可在变质蛋白KaiB中找到。随后的迭代中这种特殊安排消失,让位于扩展的αα-发夹,经过12轮精炼后,两个螺旋对齐,发夹进一步扩展,最终状态IM29与目标AS模型非常相似。
实验数据支持这些发现:氢键耦合测量表明β2-β3配对是β-片层最稳定的部分;CEST测量和尿素滴定数据表明RfaHCTD样品含有约5%的未折叠次要物种,但具有两个具有螺旋倾向的区域:127-131和136-150,这些区域具有升高的15N R2弛豫速率,可能来自螺旋-线圈交换。这些观察与IM15中137-145区域被识别为α2成核位点的结果一致。
IMSD方法在概念上类似于Harada和Kitao提出的平行级联选择分子动力学(PaCS-MD)方案,关键区别在于通过生成扩散算法(加噪-去噪步骤)而不是常规MD运行来进化结构。加噪量(即对系统的结构扰动幅度)可以任意大,这意味着IMSD可以克服高能垒,使其适用于模拟主要结构重排如变质转变。
与用于模拟折叠转换过渡的分子动力学方法相比,IMSD方案具有明显优势。当前力场甚至在模拟球状蛋白质方面都存在问题,再现变质蛋白的折叠转换中间体显然更加困难。IMSD的关键前提是最新一代预测器(如基于AF2的生成扩散算法UFConf)不仅能够有意义地预测完全折叠的蛋白质形式,还能预测部分折叠的中间体。
IMSD方法有多种参数化方式,除rmsd外还可使用其他集体变量如GDT-HA、TM分数或天然接触分数Q。基于Q的IMSD方案在某些情况下能成功再现变质转变,但并非所有情况都适用。
UFConf配备的两种原始算法中,朗之万动力学适合模拟腺苷酸激酶中的域动力学,但不适合跨越任何显著能垒;结构插值算法虽然能追踪SA1 V90T中的折叠转换过渡,但未能通过阴性对照测试,将SA1 V90T错误重折叠为不相关的HIV-1蛋白酶折叠。
研究表明,基于GDM的算法有多种可能来模拟变质蛋白中的折叠转换过渡。目前,rmsd驱动的IMSD方案似乎能产生最佳结果,为理解蛋白质功能多样性和设计新型蛋白质提供了强大工具。未来,类似算法可能发展到模拟变质进化路径(即通过累积序列变化从一种折叠进化到另一种),IMSD方案可能在探索这种转变中发挥作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号