
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于等变图神经网络与电荷平衡机制的非局域分子相互作用建模新方法CELLI
【字体: 大 中 小 】 时间:2025年09月17日 来源:npj Computational Materials 11.9
编辑推荐:
为解决机器学习原子势(MLIPs)难以高效建模长程相互作用的挑战,研究人员开发了CELLI(Charge Equilibration Layer for Long-range Interactions)模块,将其集成至等变图神经网络(GNN)框架中。该研究通过泛化经典电荷平衡(Qeq)方法,实现了对电荷转移、静电相互作用等非局域效应的精确建模,在多个基准系统中达到最先进精度,且计算成本仅轻微增加。该工作显著提升了MLIPs在生物大分子和复杂化学体系模拟中的适用性,发表于《npj Computational Materials》。
在计算材料科学与化学模拟领域,机器学习原子势(Machine Learning Interatomic Potentials, MLIPs)因其能够以接近量子力学的精度高效模拟原子间相互作用而备受关注。特别是基于图神经网络(Graph Neural Networks, GNNs)的模型,如Allegro和MACE,通过利用化学局域性假设,仅依赖局部原子环境信息即可实现高精度预测,且计算成本随原子数量线性增长,为大规模分子动力学模拟提供了可能。然而,这类模型存在一个根本性局限:它们无法有效捕捉长程相互作用(long-range interactions),例如静电相互作用、电荷转移和色散效应。这些效应在许多真实体系(如蛋白质折叠、离子液体行为和分子聚集)中起着关键作用,其作用范围可能远超过模型设定的截断半径(cutoff radius),例如蛋白质中的某些相互作用可跨越15 ?以上。
为突破这一瓶颈,以往研究尝试了多种方案。一类方法采用倒空间策略,通过在傅里叶空间中处理结构特征或学习特征来建模长程相互作用,但这类方法难以推广至不同取向的结构或其他超胞体系,且在实际模拟条件下应用受限。另一类方法通过改进消息传递(message-passing)效率,利用粗粒度或分层表示来延长相互作用范围,然而这些方法难以直接应用于体相系统。此外,物理驱动的混合方法将MLIPs与经验力场结合,分别处理短程和长程贡献,但此类方法往往无法充分捕捉原子局部环境与全局静电景观之间的动态耦合,且电荷预测常需额外校正方案来保证电荷守恒并避免非物理行为。
针对上述挑战,本研究提出了一种新颖的架构模块——长程相互作用电荷平衡层(Charge Equilibration Layer for Long-range Interactions, CELLI),将其集成至等变图神经网络MLIPs中,以高效建模非局域相互作用。CELLI的核心思想是将经典电荷平衡(Qeq)方法泛化为一个模型无关的构建块,使其能够适应现代等变GNN势函数。通过该模块,模型能够显式地预测电荷分布,并将电荷环境信息嵌入至网络的局部特征中,从而同时建模长程静电效应并调节短程相互作用对局部电荷环境的依赖。该方法在保持高计算效率的同时,显著提升了模型在涉及电荷转移和电荷状态依赖体系中的预测精度与物理合理性。
本研究发表于《npj Computational Materials》,主要采用以下关键技术方法:基于严格局部(Allegro)和消息传递(MACE)的等变图神经网络架构;电荷平衡(Qeq)方法用于全局电荷分布优化与静电势计算;平滑粒子网格埃瓦尔德(SPME)方法用于处理周期性系统的长程静电相互作用;多层感知机(MLP)用于环境依赖的电负性、硬度及电荷嵌入特征的预测;基于共价半径的原子半径参数化方案;以及基于力匹配(Force Matching)损失函数的端到端训练策略。模型在OE62数据集和SPICE数据集(包含肽类和类药物分子的多种化学物种)上进行训练与验证,并采用分子动力学模拟评估其稳定性和泛化能力。
研究人员在四个精心设计的基准系统上验证了CELLI的有效性,这些系统均包含显著的长程效应和电荷依赖性,包括碳链、银团簇、氯化钠团簇以及MgO(001)表面上的金二聚体。研究结果表明,集成CELLI的Allegro模型在几乎所有案例中均显著优于基线模型及以往的4GHDNN、LRSR和CACE-LR等方法。例如,在碳链系统中,CELLI将能量和力的均方根误差(RMSE)分别降低至0.599 meV/atom和31.00 meV/?,远优于基线Allegro的0.772 meV/atom和49.18 meV/?。值得注意的是,采用环境依赖硬度参数的CELLI变体在多数情况下表现最佳,表明其对电荷预测的改进直接贡献于整体精度提升。
为考察CELLI在更复杂化学体系中的泛化能力,研究团队进一步在OE62数据集上进行了测试。该数据集包含不同尺寸、不同化学多样性的分子体系,能够更全面地评估模型的准确性和可扩展性。结果显示,CELLI在仅轻微增加计算成本的前提下,显著优于所有Allegro基线模型,其性能甚至与参数量大得多的消息传递网络(如DimeNet++ with Neural P3M)相当。特别地,小型CELLI变体的表现优于大型Allegro基线,表明通过Qeq方案引入长程修正比单纯增加模型规模更有效。此外,CELLI在SPICE数据集子集上的分子动力学模拟中表现出良好的稳定性,能够对训练中未见的样本产生合理预测,进一步证明了其在实际模拟中的适用性。
在与消息传递模型MACE的结合测试中,CELLI同样带来了改进,尽管提升幅度较严格局部模型小,这可能是由于MACE本身已具备一定的非局部信息传递能力。值得注意的是,与专门设计用于建模电子自由度及非局部效应的SpookyNet相比,CELLI在电荷预测精度上虽存在差距,但其在能量和力预测上的表现更为稳健,说明电荷分配的准确性并不总是与整体能量力场性能直接耦合,这也印证了以往研究关于电荷分配方案可能限制模型表达能力的观点。
通过对银团簇等系统的电荷分析,研究人员还发现CELLI能够合理预测部分电荷分布,与文献值在物理合理范围内吻合。例如,在带正电和负电的银团簇中,CELLI增强的Allegro能够准确区分不同电荷状态下的最低能量构型,而基线模型则无法区分。这种能力对于模拟外电场下的系统行为或观察电荷转移过程尤为重要。
本研究提出的CELLI模块成功地将经典Qeq方法与现代等变GNN框架相结合,为MLIPs建模长程相互作用提供了一个高效、可扩展且易于泛化的解决方案。其优势体现在多个方面:首先,它不依赖于手工特征描述符,能够端到端训练,适用于化学多样性体系;其次,它能无缝集成于严格局部模型之中,利于大规模并行计算;最后,它通过显式的电荷预测提供了较高的模型可解释性。实验证明,CELLI在多个基准体系和多样化数据集中均达到了最先进水平,且计算开销仅轻微增加。
该方法的成功不仅解决了MLIPs领域长期存在的长程相互作用建模难题,也为其在生物大分子模拟、复杂材料设计及外场下系统行为预测等领域的应用铺平了道路。未来,研究团队计划将CELLI与大型分子动力学模拟框架LAMMPS集成,进一步拓展其在大规模模拟中的应用,并探索将其它物理约束集成至CELLI框架中,以进一步提升其精度与稳健性。此外,评估CELLI在预测光谱性质等模拟观测值中的能力,也将是未来研究的重要方向。
生物通微信公众号
知名企业招聘