一个用于催化作用的机器学习原子间势能数据集和模型,通过局部微调实现化学精度
《JACS Au》:A Machine Learning Interatomic Potential Data Set and Model for Catalysis with Local Fine-Tuning to Chemical Accuracy
【字体:
大
中
小
】
时间:2025年11月24日
来源:JACS Au 8.7
编辑推荐:
异相催化中,传统密度泛函理论(DFT)方法因无法准确模拟催化剂动态形貌而受限。本文提出CLAM(Catalytic Large Atomic Model)数据集及模型框架,集成金属/合金表面、二维材料及小分子数据,通过DPA2和GemNet-OC预训练模型,结合迭代式“本地微调”算法,显著提升结构优化与过渡态搜索精度(达94%化学精度)和效率(加速10-40倍)。
在催化科学领域,异质催化因其复杂的反应机制和动态变化的催化剂形态而成为研究的热点。传统密度泛函理论(DFT)方法虽然在理论上具有较高的精度,但其计算成本高昂,难以应用于大规模系统或长时间模拟。因此,寻找一种既具备高精度又具有高效计算能力的方法成为当前研究的重点。为了应对这一挑战,本文提出了一种名为“催化大原子模型”(Catalytic Large Atomic Model, CLAM)的新数据集和预训练模型,专门用于异质催化反应的机器学习原子间势能计算。此外,还引入了一种“局部微调”算法,显著提升了机器学习原子间势(MLIP)在结构优化和过渡态搜索中的准确性与效率。
### 异质催化中的挑战与现有方法的局限性
异质催化是指催化剂与反应物之间通过界面发生反应的过程,其核心在于催化剂表面的动态变化以及活性位点的多样性。传统的DFT方法虽然能够提供精确的电子结构信息,但计算过程复杂且耗时,限制了其在大规模系统和长时程模拟中的应用。相比之下,经典分子动力学方法,如嵌入原子法(EAM)和常规力场(如AMBER和CHARMM),虽然计算效率高,但缺乏对化学键断裂与形成过程的建模能力。尽管ReaxFF方法在反应性模拟方面有所突破,但其复杂的参数化过程限制了其可迁移性和广泛应用性。因此,开发一种兼具高精度与高效性的新型方法,对于深入理解催化机制和高效筛选催化剂具有重要意义。
近年来,机器学习原子间势(MLIPs)或称为机器学习力场(MLFFs)成为解决上述问题的有力工具。这些模型通过在DFT数据上进行训练,能够以较低的计算成本实现对催化反应的精确预测。代表性模型包括基于核函数的高斯近似势(GAP)和基于神经网络的Behler-Parrinello(BPNN)势。其中,基于神经网络的方法在原子间势的开发中展现出更强的潜力。这些方法通常依赖于描述原子局部环境的特征,如两体径向和三体角描述符,结合对称性不变性,从而实现对复杂系统结构的准确预测。
然而,大多数现有的MLIPs受限于训练数据集的单一性,难以泛化到多样化的催化系统。为了克服这一问题,本文构建了一个专门用于训练异质催化反应的综合数据集——CLAM。该数据集涵盖了金属和合金薄片、氧化物、簇、二维材料以及小分子等多种系统,不仅包括平衡态结构,还包含非平衡态的构型,从而覆盖了广泛结构空间。这种设计确保了CLAM作为机器学习模型训练的基础,能够适用于异质催化反应中常见的结构和能量变化。
### CLAM数据集的构建与特性
CLAM数据集的构建基于高通量计算和分子动力学(MD)模拟。所有结构优化和AIMD模拟均使用Vienna Ab initio Simulation Package(VASP)进行,计算参数与OC22数据集保持一致。具体而言,采用Perdew–Burke–Ernzerhof(PBE)泛函和广义梯度近似(GGA)来考虑交换-关联效应,并将平面波展开的动能截断值设为500 eV。几何优化和自洽场(SCF)收敛标准分别设定为0.02 eV/?和10–5 eV。在构建过程中,为了减少MLIPs对非平衡态的误差,未引入色散修正,但在后续微调过程中可灵活加入。
在数据集的采样过程中,所有生成的结构均采用大于10 ?的晶胞参数,以确保使用最小的1×1×1 k点网格进行计算。对于来自二维材料百科的数据,采用Γ中心的30×30×1 k点网格,以更好地捕捉材料的周期性特性。此外,为了提高计算效率,还对包含镧系、锕系和惰性气体的结构进行了筛选,保留了Ce和La等具有催化意义的元素。最终,CLAM数据集包含约5914个二维材料结构,以及大量金属、合金、小分子和氧化物的结构。
数据集的结构多样性使其能够适用于多种催化反应类型。例如,金属薄片和吸附物的结构、簇、二维材料以及小分子的结构均被纳入其中。通过结合几何优化和AIMD模拟,数据集不仅包含了静态结构,还涵盖了动态变化的结构,从而提高了模型对催化过程的适应性。同时,数据集中的结构经过dpdata工具收集,并对未收敛的SCF计算进行了过滤,以确保数据质量。
### 机器学习模型的训练与性能评估
在CLAM数据集的基础上,本文对两种主流的MLIP模型——DPA2和GemNet-OC进行了训练。其中,DPA2模型通过在CLAM数据集上进行微调,其精度在不同测试数据集上得到了显著提升。例如,在OC22数据集上,DPA2-CLAM模型的均方根误差(RMSE)降低至28.5 meV/?,而在QM9数据集上则降至21.5 meV/?。相比之下,GemNet-OC模型在微调后表现出更高的精度,尤其在金属和二维材料的预测上,其误差显著低于未微调的模型。然而,需要注意的是,这些模型在OC22数据集上的性能略有下降,这主要归因于训练数据的采样比例较低,导致模型在该数据集上出现了一定的偏差。
在训练过程中,采用了一种基于任务头的策略,即选择与催化相关的OC2M头进行微调。DPA2模型的嵌入网络包含三层,分别有25、50和100个神经元,而其拟合网络则由三层组成,每层有240个神经元。训练过程使用了Adam优化器,初始学习率为5.0×10–4,并在训练结束时指数衰减至3.51×10–8。GemNet-OC模型则采用AdamW优化器,训练过程进行了50轮,学习率从5×10–5逐步衰减至5.0×10–8。模型中还引入了SiLU激活函数,以增强其非线性学习能力,并启用了四体相互作用(quad_interaction)参数,以更精确地描述吸附物与基底之间的相互作用。
### 局部微调算法:提升精度与效率的平衡
为了进一步提升模型在结构优化和过渡态搜索中的准确性,本文提出了一种“局部微调”算法。该算法的核心思想是,通过引入少量的DFT标注数据,对模型进行针对性的优化,使其在特定的势能面上表现更优。这种策略避免了对整个数据集的重新训练,从而节省了计算资源,同时提高了模型在关键路径上的预测精度。
在结构优化方面,局部微调算法采用三步迭代流程:首先使用预训练模型进行结构预测,然后对预测结构进行DFT优化,以获得参考能量和力数据,最后基于这些数据对模型进行微调。这一过程在两个系统中进行了验证,即Pd(111)表面和Pd13簇上的八氢-N-乙基咔唑(ONEC)吸附过程。通过局部微调,模型在两次迭代后,吸附能误差降至0.033 eV,准确率提升至94%。而与传统DFT方法相比,计算时间减少了12.6倍,显示出显著的加速效果。
在过渡态搜索方面,局部微调算法同样表现出色。例如,在Ru(0001)表面上的NH3分解反应中,GNOC-CLAM模型在未微调时,其能量误差为0.282 eV,准确率仅为16%。但在经过三次微调后,能量误差降至0.029 eV,准确率提升至81%。这种提升不仅体现在过渡态的识别上,也体现在对反应路径的准确预测中。局部微调算法在该系统中实现了10.1倍的计算加速,显著提高了过渡态搜索的效率。
### 模型在分子动力学模拟中的表现
为了验证CLAM模型在动态催化过程中的适用性,本文还对其在分子动力学(MD)模拟中的表现进行了评估。异质催化反应通常伴随着催化剂结构的动态变化,而传统静态模型难以捕捉这种变化。因此,本文在N2/Fe(111)和CO/Cu(111)-step系统中,分别进行了GNOC-CLAM模型的MD模拟,并将其与DFT-分子动力学(AIMD)结果进行了对比。
在N2/Fe(111)系统中,GNOC-CLAM模型在400 K和600 K下的原子运动轨迹与AIMD结果高度一致。特别是在600 K下的100 ps模拟中,模型成功捕捉了从C7位点向无序构型的转变。此外,Fe–Fe、Fe–N和N–N对的径向分布函数(RDF)与AIMD结果几乎一致,表明模型能够准确描述原子间的相互作用。
在CO/Cu(111)-step系统中,GNOC-CLAM模型同样表现出色。在400 K下的模拟中,Cu、C和O原子的位置分布与AIMD结果高度吻合,而在600 K下的100 ps模拟中,模型能够动态捕捉Cu-CO物种的形成过程。Cu–Cu、Cu–C和C–O对的RDF进一步验证了模型在描述原子间相互作用方面的可靠性。
### 模型的广泛应用前景
CLAM数据集和GNOC-CLAM模型的提出,不仅为异质催化反应的高效模拟提供了新的工具,也为催化剂的筛选和设计开辟了新的路径。通过结合局部微调算法,模型能够在不牺牲精度的前提下,实现对复杂催化系统的快速预测。这种灵活性使得CLAM模型可以广泛应用于多种催化反应体系,包括金属、金属氧化物和二维材料。
此外,CLAM模型还具备良好的可扩展性,能够与其他高级计算方法相结合。例如,通过引入更高级的交换-关联泛函(如SCAN或HSE06)或色散修正(如D3),模型的预测精度和适用范围可以进一步提升。这种扩展性不仅有助于提高模型的通用性,也为未来的研究提供了更大的空间。
### 总结与展望
综上所述,本文提出了一种专门针对异质催化反应的机器学习原子间势模型——CLAM。该模型通过构建一个覆盖广泛催化系统的数据集,并结合局部微调算法,实现了对催化反应中关键参数(如吸附能、活化能)的高效和精确预测。同时,局部微调算法能够在不牺牲精度的前提下,显著降低计算成本,使其适用于高通量筛选和大规模催化研究。
未来,CLAM模型可以与微动力学模型相结合,进一步深化对催化机理的理解,并实现对催化剂的预测性筛选。此外,随着计算资源的不断增长和算法的持续优化,CLAM模型有望在更复杂的催化体系中发挥更大的作用,为催化剂的设计与优化提供强有力的支持。这一工作的开展不仅推动了异质催化研究的发展,也为机器学习在材料科学中的应用提供了新的范例。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号