NN-VRCTST:神经网络技术与变反应坐标过渡态理论结合,用于无障碍反应速率常数的测定
《Journal of Chemical Theory and Computation》:NN-VRCTST: Neural Network Potentials Meet Variable Reaction Coordinate Transition State Theory for the Rate Constant Determination of Barrierless Reactions
【字体:
大
中
小
】
时间:2025年10月23日
来源:Journal of Chemical Theory and Computation 5.5
编辑推荐:
本文提出将物理启发式人工神经网络(PHINN)与变反应坐标过渡态理论(VRC-TST)结合,用于高效计算气相无势垒反应的速率常数。通过训练PHINN模型拟合多维势能面(PES),将单点能量(SPE)计算量降低至传统方法的1/4,同时保持相对误差低于10%。方法创新性地将短程和长程PES区域分别建模,并采用多项式插值实现平滑过渡。实验验证表明,PHINN模型在5种典型反应中均显著提升计算效率,部分反应误差低于5%,且能通过动态调整数据集过滤高能态点,有效解决多参考电子结构计算中的收敛问题。该框架为复杂气相反应动力学研究提供了高效解决方案。
在化学反应动力学中,确定无势垒反应的速率常数一直是一个重要的挑战。这类反应的特点在于其反应路径上不存在明确的鞍点,因此缺乏典型的能量壁垒。这使得传统的过渡态理论(Transition State Theory, TST)难以直接应用,因为TST通常依赖于对过渡态的准确描述。然而,通过变量反应坐标TST(Variable Reaction Coordinate Transition State Theory, VRC-TST),研究人员能够更有效地计算无势垒反应的速率常数。VRC-TST的核心在于通过蒙特卡洛采样对势能面(Potential Energy Surface, PES)进行探索,从而计算和积分反应通量。这种方法在理论计算中展现出较高的准确性,能够与实验结果高度一致,其误差通常在20%以内。然而,这种方法需要大量的单点能量(Single-Point Energy, SPE)计算,通常需要数万次,这对计算资源提出了较高的要求。
为了解决这一问题,本文提出了一种新的方法,即使用物理启发的人工神经网络(Artificial Neural Network, ANN)模型来拟合PES,从而作为VRC-TST计算的替代势。这种方法被称为NN-VRCTST。通过将PES的计算任务从传统的电子结构软件转移到ANN模型上,可以显著减少计算成本,同时保持模型的准确性。ANN模型的训练过程涉及生成特定的数据集,这些数据集由反应物之间的相对几何构型和相应的SPE值组成。为了确保模型能够有效捕捉不同物理机制,数据集被划分为短程和长程两个区域,分别对应于不同的相互作用特征。短程区域主要涉及分子间近距离的多参考效应,而长程区域则受到多种电荷相互作用和极化效应的影响。
在模型训练过程中,采用了Sobol序列进行数据生成,这是一种高效的准随机采样方法,能够探索多维空间。这种方法确保了数据集的预先确定性,使得SPE计算可以独立进行,从而实现并行计算。为了进一步优化模型,对高能配置进行了筛选,设置了一个系统相关的能量阈值,通常在20–30 kcal/mol之间。这一筛选过程有助于提高模型的泛化能力,同时减少不必要的计算负担。此外,通过将短程和长程区域分别训练,可以显著降低训练数据集的规模,从而提高计算效率。
在模型设计方面,本文采用了两种不同的ANN架构:一种是黑盒模型,另一种是物理启发模型。黑盒模型通过增加隐藏层和神经元的数量来优化模型的性能,直到模型的均方根误差(Root-Mean-Square Error, RMSE)不再显著下降。而物理启发模型则结合了周期块(Periodic Block, PB)和莫尔斯块(Morse Block, MB),以更精确地模拟PES的物理特性。PB基于周期函数,用于处理角度输入的周期性,而MB则用于描述距离与能量之间的莫尔斯势关系。通过引入这些物理特征,物理启发模型在预测性能上优于黑盒模型,尤其是在广泛的温度范围内。
在模型训练和验证过程中,发现使用物理启发模型的误差率显著降低,特别是在高温区域。例如,对于CH? + CH?反应,使用PHINN模型的误差率在10%以内,而使用黑盒模型的误差率则在20%以内。此外,通过将两个模型合并,使用转移学习方法,可以构建一个统一的模型,从而在所有距离范围内保持预测的连续性。这种方法不仅减少了SPE计算的次数,还显著提高了计算速度,使得每个配置的能量计算可以在毫秒级别完成,而无需依赖于复杂的电子结构计算。
在实际应用中,这种方法被用于多个参考系统,包括CH? + CH?、C?H? + CH?、NH? + OH、CH? + H和CH?CHO + C?H?等。这些系统的反应物具有不同的自由度数量和分子结构复杂度,使得模型的适应性得到了验证。结果显示,对于包含两个重原子的系统,误差率保持在10%以下,而对于结构更复杂的系统,误差率可能上升至20%。然而,即使在这些情况下,使用PHINN模型仍然能够提供比传统方法更精确的速率常数预测,特别是在高温区域。
此外,本文还探讨了如何通过减少SPE计算次数来提高计算效率。传统的VRC-TST方法需要大量的SPE计算,通常在10?级别,而使用ANN模型后,这一需求减少了近四倍。这种减少不仅提高了计算效率,还使得模型的训练和VRC-TST计算可以分离进行,从而优化SPE计算和数据质量评估。通过这种方式,可以在不牺牲模型准确性的前提下,实现更高的计算效率。
总的来说,本文通过将人工智能与VRC-TST相结合,提出了一种新的计算方法,即NN-VRCTST。这种方法不仅显著降低了计算成本,还提高了模型的预测能力,使其在广泛的温度范围内保持较高的准确性。此外,通过引入物理启发的模型设计,使得ANN能够更有效地模拟PES的物理特性,从而提高计算效率和模型性能。未来的工作将集中在进一步优化模型参数、扩展应用范围以及开发更高效的计算流程上。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号