利用机器学习实现快速准确的环应变能量预测,并将其应用于应变促进反应中

《JACS Au》:Fast and Accurate Ring Strain Energy Predictions with Machine Learning and Application in Strain-Promoted Reactions

【字体: 时间:2025年10月23日 来源:JACS Au 8.7

编辑推荐:

  环应变能(RSE)的机器学习计算方法及数据库构建。通过AIMNet2和Auto3D实现高效RSE预测,R2达0.997,MAE为0.896 kcal/mol,较传统DFT方法提速千倍。成功应用于铜-free点击化学、[3+2]环加成和ROMP反应设计,并构建含16905种单环分子的RSE Atlas数据库。

  环张力能(Ring Strain Energy, RSE)是理解分子反应性的重要概念之一,它不仅在理论化学中具有重要意义,也在有机合成、材料设计和药物发现等多个领域发挥着关键作用。然而,目前通过实验或量子力学(Quantum Mechanics, QM)方法来定量计算RSE仍然面临诸多挑战。实验方法需要大量的时间和资源,而量子力学计算则通常需要较高的计算成本和较长的计算时间,这限制了RSE在大规模应用中的可行性。为此,我们提出了一种基于机器学习(Machine Learning, ML)的方法,能够高效、准确地预测RSE,完全绕过传统的量子力学计算过程。该方法结合了AIMNet2机器学习势能模型和Auto3D工具,用于识别低能构象并计算RSE。在与ωB97M-D4/Def2-TZVPP方法的对比实验中,该方法取得了R2值为0.997和平均绝对误差(Mean Absolute Error, MAE)为0.896 kcal/mol的优异结果,同时其计算速度比传统DFT方法快几个数量级。

环张力能的计算基于分子环结构与无张力结构之间的能量差异。在传统方法中,为了计算RSE,通常需要确定一个合适的无张力参考分子,然后通过能量差来估算环张力。然而,选择合适的参考分子并不是一个明确的过程,尤其是在处理复杂分子时,这种方法变得不够可靠。另一种方法是通过环键角和环弯曲力常数来估计RSE,但准确量化这些力常数同样具有挑战性。因此,开发一种能够自动构建反应方程并计算RSE的方法显得尤为重要。

我们的工作提出了一种基于AIMNet2的RSE计算流程,该流程通过构建同构反应(homodesmotic reaction)来计算RSE。在构建同构反应时,首先需要识别分子中的环结构,然后通过断开一个环键来生成一个无张力的参考分子。为了确保反应方程的平衡,通常会引入乙烷等分子作为参考。这一流程不仅减少了人为干预,还提高了计算效率。通过这一方法,我们成功地对一系列环系统进行了RSE计算,并与文献中的实验数据进行了对比,验证了该方法的可靠性。

在实际应用中,我们进一步利用这一流程对铜自由点击化学(copper-free click chemistry)中的反应性分子进行了筛选。环张力的释放是该类反应的重要驱动力,因此准确计算RSE对于预测反应活性具有重要意义。我们选择了多种环辛炔衍生物,并通过实验测定了它们的第二阶反应速率常数,以评估RSE与反应活性之间的关系。结果表明,当RSE低于某个阈值时,分子的反应速率较低,而当RSE较高时,分子的反应活性则显著提升。这一趋势在图中得到了清晰的展示,表明RSE能够有效区分反应性与非反应性分子。

此外,我们还对[3+2]环加成反应进行了评估,发现RSE与反应能之间存在显著的相关性。在这些反应中,反应物的RSE通常较高,而产物的RSE较低,这表明反应过程中通常伴随着环张力的释放。通过这一流程,我们能够快速、大规模地计算RSE,从而为反应设计提供有价值的指导。

在环开反应(Ring Opening Metathesis Polymerization, ROMP)的研究中,我们验证了RSE对反应活性的影响。环张力的释放是ROMP反应的重要驱动力,因此准确计算RSE对于选择能够有效聚合的单体具有重要意义。我们选择了107种环状烯烃单体,并通过实验评估了它们的聚合行为。结果表明,RSE较高的单体通常具有更高的反应活性,而RSE较低的单体则表现出较低的反应速率。这一趋势在图中得到了清晰的展示,进一步验证了RSE在反应设计中的重要性。

为了进一步支持反应设计,我们构建了一个名为“RSE Atlas”的数据库,其中包含了16,905种单环分子。这些分子涵盖了从商业化合物(如Sigma-Aldrich、Enamine、WuXi、MolPort)和文献报道的合成块(如PubChem、SureChEMBL)中提取的环结构。该数据库不仅包含了丰富的环结构,还覆盖了多种元素,如S、P、Se、B和I。环的大小范围从3到9,涵盖了各种常见的环结构。通过这一数据库,我们能够直观地了解不同结构因素对环张力的影响,为反应设计提供重要的参考。

RSE Atlas的构建基于对高和低RSE值的环结构的采样,并通过ωB97M-D4/Def2-TZVPP方法进行了验证。结果表明,该方法与DFT方法表现出高度的一致性,R2值为0.99,MAE值为1.76 kcal/mol。通过这一数据库,我们能够快速查找和筛选特定结构的分子,从而为开发新的化学反应提供数据驱动的策略。例如,Garg和Hoye研究小组最近报道了利用高度张力环结构的合成方法,而这些结构的类似物在RSE Atlas中均有记录,为未来的反应发现提供了潜在的线索。

综上所述,RSE是理解环状分子反应性的重要参数,而我们提出的基于AIMNet2和Auto3D的机器学习方法能够高效、准确地预测RSE,为反应设计提供了新的工具。通过构建RSE Atlas,我们不仅能够直观地分析环张力的变化趋势,还能够为开发新的化学反应提供重要的参考。尽管当前的研究存在一些局限性,如仅限于单环分子,但通过进一步的研究,我们有望扩展这一方法,使其适用于多环分子的计算,并在柔性大环分子的构象搜索方面取得进展。这些进展将有助于推动环张力控制反应设计的发展,为化学研究和工业应用提供新的思路和方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号