基于深度生成模型的蛋白质温度依赖性结构集成建模

《Communications Chemistry》:Deep generative modeling of temperature-dependent structural ensembles of proteins

【字体: 时间:2025年11月19日 来源:Communications Chemistry 6.2

编辑推荐:

  本研究针对分子动力学模拟计算成本高、难以捕捉蛋白质构象集成的问题,开发了aSAM(原子结构自编码器模型)及其温度条件版本aSAMt。该模型通过潜在扩散技术学习分子动力学数据,能够高效生成全原子蛋白质构象集成,并准确模拟主链和侧链扭转角分布。研究表明,aSAMt不仅能捕捉温度依赖的集成特性,还能推广到训练温度范围之外,为研究蛋白质热稳定性和能量景观探索提供了新工具。

  
蛋白质是生命活动的主要执行者,其功能不仅取决于静态三维结构,更与动态的构象变化密切相关。传统的结构预测方法如AlphaFold2虽在静态结构预测方面取得突破,但在捕捉蛋白质动态行为方面仍面临挑战。分子动力学模拟虽能描述生物分子动态过程,但计算成本极高,限制了其大规模应用。
为突破这一瓶颈,密歇根州立大学的Giacomo Janson等研究人员在《Communications Chemistry》上发表了最新研究,开发了一种基于深度学习的生成模型aSAM,能够高效生成蛋白质的全原子构象集成。该研究的创新之处在于引入了温度条件版本aSAMt,首次在序列可转移的模型中实现了对环境条件的集成生成。
研究人员采用两阶段训练策略:首先训练自编码器将蛋白质重原子坐标编码为SE(3)不变潜在表示,然后训练去噪概率扩散模型学习潜在空间中MD结构的分布。模型在ATLAS和mdCATH两个大型MD数据集上进行训练和评估,其中mdCATH包含数千个球状蛋白结构域在320-450K温度范围内的模拟数据。
研究结果显示,aSAM在ATLAS数据集上的表现与当前最先进的AlphaFlow相当,但在计算效率上提升17-54倍。更重要的是,aSAMt能够准确捕捉温度依赖的集成特性,如初始结构均方根偏差、回转半径和二级结构元素保留率的变化。模型还能模拟蛋白质解折叠过程,生成类似实验熔解曲线的温度依赖曲线。
在技术方法方面,研究主要采用:1)基于Transformer的自编码器架构实现蛋白质结构的SE(3)不变编码;2)去噪扩散概率模型学习潜在空间分布;3)温度条件化机制实现多温度采样;4)基于Amber ff99SB力场的受限能量最小化优化生成结构。
基准测试aSAM在ATLAS上的表现
与AlphaFlow相比,aSAMc在局部灵活性和全局构象采样方面表现相当,但在主链和侧链扭转角分布学习方面更优。对于刚性较强的蛋白质如6h49_A,两种模型都能较好捕捉局部动力学和构象多样性。然而,对于具有复杂多状态集成的蛋白质,两种模型都难以采样远离初始结构的构象状态。
aSAMt学习温度依赖行为
aSAMt能够准确再现MD集成特性及其温度依赖性,包括initRMSD和Rg随温度升高而增加,SSEP随温度升高而降低的趋势。模型在320K时对折叠状态分数的预测误差仅为0.016,表现出色。通过PCA和Jensen-Shannon散度分析发现,aSAMt生成的集成在全局特性上接近独立MD轨迹产生的集成。
温度插值和外推
aSAMt能够对训练温度范围之外的温度进行合理采样。在250-670K范围内,模型生成的熔解曲线呈现典型的S形,与实验和模拟观察一致。即使在外推到670K时,生成的结构仍保持合理的物理特性,重原子冲突数大多低于每个分子1个。
快速折叠蛋白的能量景观
与DEShaw Research的长时程MD模拟比较发现,aSAMt能够覆盖小蛋白能量景观的广泛区域,包括非天然状态的采样。然而,模型在正确再现不同状态间的相对概率方面存在局限,这主要源于训练数据的有限采样时间尺度。
热稳定性预测
aSAMt对62个单体蛋白的实验Tm值预测与实验值相关性良好(r=0.510),尽管系统性地高估了131K。对同源蛋白对的分析显示,模型能够定性捕捉热稳定性差异,如核糖体L30E蛋白中嗜热蛋白与中温蛋白的Tm差异。
研究表明,基于MD的生成模型在探索蛋白质能量景观和模拟环境条件影响方面具有巨大潜力。虽然目前在正确学习平衡概率和完全覆盖相关状态方面仍存在挑战,但aSAMt为代表的温度条件生成模型为蛋白质动态学研究提供了新范式。未来通过整合实验约束和物理原理,这类模型有望在生物医学研究中发挥更大作用。
这项工作的意义在于将深度学习集成生成推广到环境条件的包含,为在原子细节上高效研究蛋白质在不同物理条件下的行为提供了可行路径。通过将温度作为连续变量条件化,aSAMt实现了对蛋白质热响应行为的定量建模,为理解温度对构象平衡的影响提供了新视角。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号