
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:机器学习原子间势能在生物分子建模中的原理、架构与应用
【字体: 大 中 小 】 时间:2025年08月10日 来源:Biophysical Reviews 3.7
编辑推荐:
(编辑推荐)本综述系统阐释机器学习原子间势能(MLIPs)如何突破传统力场(FFs)和密度泛函理论(DFT)的局限,通过图神经网络等架构实现近DFT精度的生物大分子模拟,在酶催化、构象采样等领域展现革命性潜力。
传统力场(FFs)虽因计算高效被广泛使用,却难以准确描述化学反应和复杂生物环境;量子力学方法如密度泛函理论(DFT)精度虽高,但对生物大分子计算成本过高。机器学习原子间势能(MLIPs)通过直接从量子数据中学习,以近DFT精度逼近势能面,成功弥合了这一鸿沟。
MLIPs的核心是通过能量和力数据训练模型,同时嵌入物理对称性约束。主流架构包含三类:基于描述符的模型(如Behler-Parrinello网络)、图神经网络(GNNs)以及近年兴起的等变神经网络(Equivariant NNs)。其中,等变架构通过SE(3)群变换保持旋转平移不变性,显著提升了对分子取向的泛化能力。
• 构象采样:MLIPs在蛋白质折叠路径模拟中捕获到传统力场遗漏的中间态,如α-螺旋到β-折叠的转变能垒
• 酶催化:精确描述水解酶活性中心的质子转移势垒,误差较AMBER力场降低80%
• 药物结合:预测GPCR-配体结合自由能与实验值误差<1 kcal/mol,显著优于MM/PBSA方法
尽管与OpenMM、LAMMPS等分子动力学软件的对接已实现标准化,MLIPs仍面临三大瓶颈:
分布外(OOD)体系泛化性不足,如过渡金属配合物模拟易出现能量突变
黑箱特性导致机理解释困难
高质量量子数据稀缺,特别是激发态反应路径
混合建模(Hybrid ML/FF)和主动学习正逐步解决数据瓶颈,而新型架构如Transformer-MLP混合模型在长程相互作用建模中展现优势。随着AlphaFold引发的结构生物学革命,MLIPs有望在酶工程改造和变构药物设计中成为下一代核心工具。
生物通微信公众号
知名企业招聘