
-
生物通官微
陪你抓住生命科技
跳动的脉搏
用于数据优化和高效训练反应式机器学习力场的相似性度量方法,以应用于烃类辐射分解过程
《Journal of Chemical Theory and Computation》:Similarity Metric for Data Optimization and Efficient Training of Reactive Machine Learning Force Fields for Hydrocarbon Radiolysis
【字体: 大 中 小 】 时间:2025年11月03日 来源:Journal of Chemical Theory and Computation 5.5
编辑推荐:
基于机器学习的反应力场优化方法在聚乙烯辐解中的应用研究。通过余弦相似度筛选关键数据点,将训练集规模缩减70%的同时保持模型精度,并验证其适用于不同烃类系统。采用切比雪夫多项式构建ChIMES模型,有效提升计算效率,为聚合物辐解研究提供新工具。

辐射分解是一种常用的方法,用于对聚合物进行灭菌、化学改性以实现再利用,并加速其分解以利于回收。反应分子动力学(MD)模拟为生成反应过程的原子级轨迹和量化辐射分解的化学降解路径提供了强大的工具。为此,现在广泛使用具有量子力学精度的机器学习(ML)替代模型来表示反应力场,这些模型需要能够提供目标化学系统原子环境信息的ML训练数据集。然而,辐射分解化学过程可能非常复杂且多样化,这为生成用于参数化ML模型的训练数据带来了重大挑战。在这方面,我们开发了一种方法,利用余弦相似度指标来优化训练数据集,以帮助选择用于聚乙烯(一种模型烃类聚合物)辐射分解的训练数据集,并提高我们的反应ML力场(MLFF)在各种分子和聚合物系统中的适用性。我们的方法通过逐个原子比较局部原子环境,来识别与罕见和局部事件(如结构内的辐射分解损伤)相关的重要数据点。我们应用这种方法来训练切比雪夫相互作用模型高效模拟(ChIMES)MLFF模型,该模型用多体切比雪夫多项式的线性组合来表示原子相互作用势。首先,我们证明了我们的方法可以将训练数据集的大小减少约70%,同时相比更标准的MD模型拟合方法提高了整体准确性。然后,我们在广泛的热力学条件下,使用我们的最优模型对包括简单烷烃和含有不饱和碳键的系统在内的多种烃类模拟数据进行了验证。最后,我们利用ChIMES模型对大规模系统进行辐射分解损伤的MD模拟,从而避免了系统尺寸效应的影响。总体而言,我们的方法得到的MD力场保留了原始量子方法的大部分准确性,同时在计算效率上提高了多个数量级。我们的工作将对未来的烃类聚合物辐射分解研究产生影响,在这些研究中,聚合物与辐射相互作用的化学细节会对实验观察到的产物产生重要影响。
生物通微信公众号
知名企业招聘