机器学习的Fock矩阵

《JACS Au》:Machine Learned Fock Matrix

【字体: 时间:2025年10月23日 来源:JACS Au 8.7

编辑推荐:

  高效预测分子电子结构的机器学习自洽场方法(miSCF)通过原子信息和几何特征构建Fock矩阵,利用核正则回归替代两电子积分计算,在H2、H2O链及冰结构测试中展现高精度(误差<1.0 mH)和强迁移性,支持从简单分子到周期系统的扩展应用。

  本文介绍了一种全新的机器学习积分自洽场方法(miSCF),旨在提高分子电子结构预测的效率。在量子化学计算中,传统的自洽场(SCF)方法虽然能够准确地计算分子轨道和波函数,但其计算成本较高,尤其是对于涉及大量电子相互作用的系统,如两电子积分矩阵(G矩阵)的计算,往往成为主要的瓶颈。miSCF通过引入机器学习策略,对两电子积分进行拟合,从而显著降低了计算复杂度,同时保持了较高的预测精度。这种方法的核心在于构建包含原子信息和几何特征的描述符,使模型具备良好的泛化能力和跨系统迁移性,从而能够以更少的训练数据实现对多种分子系统的准确预测。

在量子化学研究中,传统的计算方法通常采用单任务学习模型,专注于预测单一化学性质。然而,这种模型在处理多属性预测时存在局限,需要为每个属性单独训练模型,且难以在不同系统之间进行有效的数据迁移。为了解决这一问题,近年来多任务学习模型逐渐被引入,这些模型通过整合多个化学属性的预测,提升了计算的效率和扩展性。例如,Hegde和Bowen利用核岭回归(Kernel Ridge Regression, KRR)预测密度泛函理论(DFT)中的哈密顿矩阵,成功地模拟了分子的能带结构和电子传输特性。Schütt等人提出的SchNorb模型则能够预测分子波函数,并进一步推导出电荷分布和HOMO-LUMO间隙等属性。随后,Gastegger对这一模型进行了优化,提高了其预测效率。2021年,Unke等人开发的PhiSNet模型通过等变原子特征预测波函数和电子密度,确保了物理性质在平移和旋转操作下的不变性。尽管这些方法在提升模型的扩展性和迁移性方面取得了进展,但它们仍然需要针对不同系统重新训练,导致跨系统迁移能力有限。

针对这一问题,本文提出了一种基于原子信息和几何特征的机器学习方法,用于构建Fock矩阵,从而实现对电子结构的高效预测。该方法不仅能够预测分子能量、轨道能量、电子密度和Mulliken电荷分布等属性,还能够通过小规模分子数据库的训练,推广至更大的团簇或周期性系统,如冰结构。这种方法的核心在于设计了三种关键的描述符:积分相似性描述符、几何描述符和角动量描述符。积分相似性描述符基于一电子积分矩阵(T和V矩阵)来捕捉分子中电子相互作用的特征,几何描述符则利用分子的几何信息,如键长和原子类型,以更全面地表达分子结构,而角动量描述符则用于表征原子轨道之间的角动量耦合特性。这些描述符的组合不仅提高了模型的泛化能力,还增强了其在不同化学系统中的迁移性。

在计算过程中,miSCF利用这些描述符对两电子积分进行拟合,从而避免了传统SCF方法中繁琐的积分计算。具体来说,Fock矩阵由一电子积分矩阵和两电子积分矩阵构成,其中一电子积分矩阵的计算成本较低,而两电子积分矩阵的计算则较为复杂,通常需要大量的计算资源。通过机器学习方法对两电子积分进行拟合,miSCF能够在保证预测精度的同时,显著提高计算效率。此外,该方法还能够利用标准SCF计算得到的重叠矩阵(S矩阵)和一电子积分矩阵(T和V矩阵)作为输入,进一步简化计算流程。这种设计使得miSCF在处理复杂分子系统时具备更高的灵活性和效率。

为了验证miSCF的预测性能,本文对其在多个代表性分子系统中的表现进行了测试,包括H?、H?O链和冰结构等。测试结果表明,miSCF在预测分子能量、波函数和电子密度方面均表现出良好的精度。例如,在H?、Li?和LiH等简单分子中,预测误差接近于零,而在更复杂的分子如N?、O?、F?、HF、CO和H?O中,误差控制在1.0 mH以内,符合化学计算所需的精度标准。对于H?O链和冰结构,miSCF在预测Fock矩阵和分子能量时,误差分别控制在0.50 mH和0.10 mH以内,进一步证明了其在复杂系统中的适用性。这些结果表明,miSCF不仅能够高效地处理小分子系统,还能在更大的团簇或周期性系统中保持较高的预测精度。

在分子轨道和波函数的预测方面,miSCF同样表现出色。通过对比标准SCF方法,miSCF在预测分子轨道能量时,误差范围较小,尤其是在占据轨道(occupied orbitals)的预测中,误差控制在0.05 mH以内,而在非占据轨道(virtual orbitals)的预测中,误差略有增加,但整体影响不大。对于H?O分子,其HOMO和LUMO轨道的预测结果与标准方法几乎一致,表明miSCF能够准确地描述分子的电子结构。此外,通过Koopmans定理,miSCF还成功预测了H?和H?O链系统的电子亲和能、电离能和HOMO-LUMO间隙等重要电子属性,其预测结果与标准方法高度一致,进一步验证了其在电子结构预测方面的可靠性。

在电子密度和Mulliken电荷分布的预测方面,miSCF同样展现了其优势。电子密度的预测误差低于10??,表明该方法能够精确地模拟分子中电子的空间分布。对于H?O分子,其Mulliken电荷分布的预测结果与参考值高度吻合,说明miSCF不仅能够准确描述分子整体的电子行为,还能在原子层面提供可靠的电荷分布信息。这种高精度的预测能力使得miSCF在分析分子电子结构时具有广泛的应用前景,尤其是在需要精确电子密度信息的化学反应和材料设计研究中。

此外,miSCF在几何优化方面的表现也十分优异。通过对比标准SCF方法,miSCF在预测分子键长时的误差极小,最大误差仅为0.004 ?,而最小误差接近于零。这表明miSCF不仅能够准确地预测分子的电子结构,还能高效地优化分子几何构型,为后续的分子动力学模拟和化学反应研究提供了坚实的基础。在H?链和H?O链的几何优化测试中,miSCF能够快速收敛,其预测结果与标准方法高度一致,进一步证明了其在实际应用中的可行性。

为了进一步验证miSCF的跨系统迁移能力,本文还对其在冰结构中的表现进行了分析。冰结构作为复杂分子系统的代表,通常涉及大量的水分子相互作用,其电子结构的计算对计算资源的要求较高。然而,miSCF通过利用局部化学环境的描述符,能够快速构建大系统的Fock矩阵,无需从头开始计算。测试结果表明,miSCF在预测(H?O)???系统的Fock矩阵时,其预测值与参考值之间的相关性极高(R2=0.9999),并且电子能量误差控制在0.10 mH以内。这一结果不仅证明了miSCF在复杂系统中的有效性,还表明其具备良好的泛化能力,能够在不同分子系统之间实现高效的数据迁移。

综上所述,miSCF方法在电子结构预测方面展现出显著的优势。它不仅能够通过机器学习策略大幅降低计算成本,还能在保持高精度的同时,实现对多种分子系统的跨系统迁移。这种方法的成功应用为量子化学计算提供了一种新的工具,使得在资源有限的情况下,也能高效地进行复杂分子系统的电子结构分析。未来,随着方法的进一步优化和扩展,miSCF有望在更广泛的化学系统和应用领域中发挥重要作用,如分子动力学模拟、化学反应路径分析和材料设计等。同时,miSCF的提出也为机器学习在量子化学领域的应用提供了新的思路,推动了该领域向更高效率和更广泛适用性的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号