综述:全原子病毒模拟助力应对空气传播疾病

【字体: 时间:2025年05月07日 来源:Current Opinion in Structural Biology 6.1

编辑推荐:

  本文聚焦全原子(AA)分子动力学(MD)病毒建模的计算研究。阐述构建和模拟完整病毒面临的挑战、解决方案及进展,探讨其在理解病毒空气稳定性方面的作用,强调跨学科合作对呼吸道疾病研究的重要性。

  

引言


病毒疾病严重威胁着全球人类、宠物、牲畜和农作物的健康。其中,空气传播的病毒难以防控,像 SARS-CoV-2 和流感等呼吸道病毒,可通过呼吸道气溶胶(RAs)在人与人之间传播,且能在空气中长时间保持感染性 。作物病毒会借助风扩散,破坏农业经济;水传播病毒在洪水时可能气溶胶化,引发卫生问题。

分子动力学(MD)模拟在研究病毒相关生物物理相互作用中意义重大。自 COVID-19 大流行以来,MD 模拟助力发现了针对 SARS-CoV-2 蛋白酶的新型抗病毒药物,阐释了其聚糖的结构和功能,揭示了刺突(S)受体结合域的开放途径、S-ACE2 结合机制等,还为免疫原、抑制剂和生物传感器的设计提供了指导。

随着计算技术发展,MD 模拟已达到中尺度时空分辨率,能构建和模拟完整病毒及气溶胶。全原子(AA)模拟可处理包含数百万到数十亿原子的系统,但与粗粒化(CG)方法相比,计算成本较高,相关方法仍需持续改进。

初始状态构建和模拟


蛋白质制备


从蛋白质数据库(PDB)获取的蛋白质结构常需后续处理,像用 ChimeraX 和 PyMOL 填补缺失坐标、残基和环;对结构未知的序列,可借助 MODELLER 或 AlphaFold3 进行同源建模和结构预测 。此外,还能通过 CHARMM-GUI 网络服务器、doGlycans 或 GlycoShape Re-Glyco 添加翻译后修饰,如糖基化和棕榈酰化。糖基化在病毒生命周期和免疫识别中至关重要,MD 模拟有助于深入了解其功能。若糖谱信息不全,可参考相关数据库选择合适的聚糖结构,新推出的 Re-Glyco 能精准识别糖基化位点并还原聚糖结构。

衣壳和包膜


病毒衣壳是包裹遗传物质的蛋白质外壳,由亚基自组装成螺旋或二十面体结构。构建衣壳模型需了解其对称性和亚基结构,通过坐标变换组装亚基。有包膜病毒的包膜是脂质双层,建模时要考虑脂质组成、膜蛋白和整体形态。脂质组成可依据脂质组学数据确定,膜蛋白按实验化学计量比添加,形态可通过冷冻电镜 / 断层扫描(cryo-EM/ET)数据获取或近似。构建包膜病毒初始状态的流程通常是先构建脂质囊泡,叠加蛋白质,再去除重叠脂质。虽然有多种构建 AA 膜的工具,但确保脂质处于或接近平衡表面压力仍是难题。目前提出了部分限制模拟、迭代结构优化等解决方案,CG 包膜模型的构建方法也可为 AA 模型提供参考,如从已平衡的 CG 模型反向映射生成 AA 结构。

基因组


在中尺度建模中,研究人员需要解决遗传物质的包装问题。病毒基因组结构可通过 cryo-EM 技术绘制,但数据分辨率不一致,结构拟合难以自动化。Farafonov 等人模拟了完整的 MS2 病毒及其基因组,采用现有方法半自动重建和拟合遗传物质。此后,出现了多种基于机器学习的工具,可自动将 AA 结构拟合到 cryo-EM 模型,如 DeepTracer、CryoREAD 等,其中 auto-DRRAFTER 和 EMRNA 可用于完整 RNA 结构建模。此外,还有研究探索从头构建基因组,通过自定义折叠模拟,先折叠粗粒化聚合物模型,再进行分辨率转换。核酸结构预测推动了深度学习算法发展,如 RhoFold+和 NuFold 等工具不断涌现。

大规模模拟的注意事项


大规模系统的构建、模拟和分析除了要考虑内存和数据存储需求,还有诸多特殊要点。例如,很多结构和轨迹文件格式对粒子数量有限制,像 PDB 原子索引限制为 5 个字符,GROMACS 的 xtc 文件粒子上限为 130M 。而 NAMD 支持的 js 和 namdbin 文件能高效存储超过 99,999 个原子的系统。选择 MD 引擎和模拟参数时要综合考虑计算资源,NAMD 针对 HPC GPU 架构的大系统进行了优化,GROMACS 在 HPC CPU 架构下对大系统的扩展性良好。采用氢质量重分配方案可将积分时间步长加倍,提升模拟效率。同时,合理降低坐标、速度和能量的输出频率,能在满足研究需求的前提下减少数据存储量。

关键发现


模拟病毒基因组的重要性


多项研究凸显了模拟病毒基因组的重要性。对 HK97 噬菌体和 HIV-1 衣壳分别在有、无基因组的情况下进行模拟,虽包装过程不同,但都发现核酸的存在会诱导衣壳扩张、增加结构刚性、减少水运输。在 HK97 噬菌体中,基因组还会影响离子分布,使衣壳极化。此外,对禽传染性脑脊髓炎病毒的研究表明,与衣壳结合的 RNA 片段能稳定整个病毒粒子,这意味着即使在完整基因组结构未解析时,纳入遗传物质片段也有助于提升研究结果的生物学相关性。

病毒包膜蛋白的原位采样


对两种 H1N1 流感病毒变体的模拟显示,模拟整个病毒虽耗费大量计算资源,但优势明显。流感病毒表面密集分布着血凝素(HA)和神经氨酸酶(NA)糖蛋白,模拟整个包膜可按其原位排列初始化数百个蛋白质拷贝,获取的数据能反映每个糖蛋白所处微环境的异质性。通过马尔可夫状态建模(MSM)分析这些数据,发现 HA 三聚体有倾斜和呼吸运动,NA 四聚体也会发生显著倾斜运动,这些运动会暴露隐藏的抗原表位。与单糖蛋白的小规模模拟对比可知,完整病毒模拟中的拥挤环境会增加病毒糖蛋白的倾斜程度,而模拟病毒膜局部拥挤环境的小系统可能是研究糖蛋白原位动力学的可行策略。

空气传播病毒的模拟


利用经典 AA MD 模拟 SARS-CoV-2 在含 10 亿多个原子的完整呼吸道气溶胶(RA)中的传播,探究 Ca2+对病毒动力学的影响。RA 包含呼吸道粘蛋白和肺表面活性剂等成分。在大气中,水分蒸发会使溶质浓度升高,由于 Ca2+可诱导呼吸道粘蛋白聚集,研究人员推测气溶胶中 Ca2+浓度增加可能影响 S 蛋白转变动力学、粘蛋白和表面活性剂结合以及病毒的整体形态和稳定性。初步结果显示,粘蛋白和表面活性剂易与 S 蛋白和病毒膜结合并聚集,表面活性剂会在气 - 气溶胶界面积累形成单分子层。此前对海洋生物气溶胶的研究为该研究提供了基础,这些研究为理解病毒空气稳定性奠定了基础。

展望和结论


原子计算病毒学在空气传播传染病研究中前景广阔,但目前对病毒空气稳定性的具体机制了解有限。借助新兴的 AA 病毒模型,可在气溶胶传播背景下研究完整病毒,为实验表征提供支持。以 SARS-CoV-2 为例,呼气时 RA 的 pH 值会快速变化,环境 CO2浓度与病毒空气稳定性相关,AA MD 模拟可深入探究 pH 值对病毒稳定性和动力学的影响机制。此外,RA 的相态也会影响病毒稳定性,MD 模拟可研究呼吸道病毒与共气溶胶化的肺部有机物的相互作用。

虽然目前 10 亿原子规模的模拟受计算资源限制,但较小的非包膜呼吸道病毒和一些环境病原体更易于模拟。这些研究不仅有助于防控疾病传播,还能为药物、疫苗等的气溶胶递送提供参考。未来,多尺度方法的持续创新至关重要,包括高效构建和平衡大规模模型、整合实验数据、优化基因组包装及大数据分析工具等。同时,加强计算病毒学和实验病毒学的交流合作,能让关键研究成果更好地应用于公共卫生政策制定和疾病防控策略。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号