筛选Diels–Alder反应的空间,以确定适用于自修复聚合物应用的候选反应

《Digital Discovery》:Screening Diels–Alder reaction space to identify candidate reactions for self-healing polymer applications

【字体: 时间:2025年10月25日 来源:Digital Discovery 5.6

编辑推荐:

  自修复聚合物、Diels-Alder反应、机器学习、计算化学、热可逆性、分子动力学模拟、化学信息学、反应筛选、过渡态计算、数据高效

  塑料和更广泛的聚合物是现代社会不可或缺的材料,广泛应用于(生物)医学、(微)电子、食品工业和航空航天等多个领域。它们的普及主要得益于其低密度、高耐久性和成本效益。然而,聚合物对机械损伤的敏感性常常限制了其使用寿命和性能,进而导致不可持续的废弃物产生。与生物材料不同,聚合物缺乏内在的自修复能力,这意味着裂纹或微裂痕会显著降低其耐用性。因此,每年产生大量塑料垃圾,给环境和可持续发展带来严峻挑战。为应对这一问题,过去三十年来,人们日益关注自修复/可回收材料作为提升聚合物系统寿命和可持续性的有前景策略。

自修复材料可以分为两大类:自主型和响应型系统。正如其名称所暗示的,自主系统是指在检测到机械损伤后能够自动释放修复剂的材料,即无需外部干预即可实现修复。相比之下,响应型材料需要外部因素来启动修复过程。这些系统通常依赖于键断裂和键重新形成机制,要求具备良好可逆性的反应能够通过外部刺激(如温度变化)进行高效控制。鉴于其实际性和广泛适用性,热激活是一种特别有吸引力的方法,使其成为自修复塑料开发的首选策略。

由于其可调节的热力学和动力学特性,特别是狄尔斯-阿尔德(Diels–Alder, DA)反应,近年来成为自修复聚合物研究的重点。DA反应属于[4 + 2]环加成反应,描述了两个不饱和分子之间的协同反应,分别称为二烯和亲二烯体。其反应过程中形成的碳-碳键通常比系统中的其他键更弱,因此更容易受到机械变形的影响。然而,对于可逆的DA反应,这些键可以重新形成,从而实现聚合物网络的恢复。这一特性使DA反应成为自修复材料的理想候选。

目前,自修复聚合物的开发仍主要依赖于直觉和试错法,而非系统性设计。为了实现理性设计,需要建立分子结构与材料宏观性能之间的关系。尽管DA单体的反应特性并不唯一决定自修复聚合物的性能(例如聚合物主链、化学计量比等在确定玻璃化转变温度中起重要作用),但它们无疑是重要的设计参数,可用于筛选不利组合并识别有潜力的组合。因此,如何高效地筛选具有合适热响应特性的DA反应,成为自修复聚合物设计的关键。

从反应性角度来看,适用于热响应自修复的DA反应必须是(轻微)放热的,或者更准确地说,其产物必须具有热不稳定性。在常温下,反应的平衡应偏向产物侧,但在加热条件下,系统应能够逆转反应,通过逆向DA反应(retro-DA)再生前体。这意味着在高温下,熵的贡献必须足以抵消反应放热倾向对产物形成的热力学驱动力。除了热力学,动力学同样重要:正向和逆向的活化能垒决定了在损伤部位自由单体能否以特定速率和温度重新生成,以及自修复能否在特定条件下发生。

值得注意的是,能够通过调整反应能垒来微调自修复温度的能力是高度理想的,因为理想的操作温度会根据自修复塑料的具体应用场景而有所不同。例如,在日常生活中应用的自修复材料,如软体机器人,可能更倾向于低温自修复以确保安全性;而在航空航天等极端环境下使用的塑料则应具备更高的耐温性,即在较高温度下仍能保持完整。因此,如何实现对反应能垒的精确调控,是设计高性能自修复材料的关键。

在理论上,给定的二烯-亲二烯体对的反应性质可以通过量子化学方法,如密度泛函理论(Density Functional Theory, DFT)进行模拟。然而,定位过渡态(Transition State, TS)在势能面上是一项非平凡的任务,且要获得与实验结果一致的高精度结果,需要使用高阶计算方法,这会带来巨大的计算成本。因此,传统的DA反应研究通常仅限于少数模型反应,从中提取定性趋势。系统地探索DA反应库,特别是在自修复聚合物的背景下,仍然难以实现。

机器学习(Machine Learning, ML)的出现,使得在理论上大规模筛选化学反应空间成为可能,近年来也推动了高通量反应发现协议的开发。在ML模型中,可以分为基于图结构和基于几何结构的两种主要类型。前者计算速度快,仅需简单的反应SMILES输入即可生成预测,且无需进行构象搜索,因此预测可在毫秒内完成。然而,基于图的模型通常只能达到几kcal mol?1的精度,而基于几何结构的模型在有足够的训练数据时,可以达到接近甚至低于化学精度(±1 kcal mol?1)的水平,但计算成本较高,因为需要首先确定准确的几何结构作为输入。

有效应用ML探索化学反应空间的关键在于高质量的训练数据。训练数据通常通过DFT生成,因此仍面临上述计算成本问题。文献中大多数反应筛选研究表明,通常需要数千个反应能垒数据才能构建准确模型,这对应于数百万CPU小时的计算时间。鉴于此,传统方法在探索大规模DA反应库时效率较低,难以满足自修复材料开发的需求。

本文提出了一种结合分层ML反应筛选与高效计算的协同反应筛选方法。通过我们自主研发的TS-tools软件,能够快速生成半经验(如xTB)水平的反应能垒数据。TS-tools是基于文本反应SMILES输入定位过渡态的Python工具包。随后,我们对生成的反应能垒数据进行少量的DFT精炼,从而训练出一个基于几何结构的深度学习模型,即DeepReaction。该模型利用DimeNet++模块进行结构嵌入,输入包括反应物、产物和过渡态的几何结构,以及xTB水平的活化能和反应自由能。最终生成的模型在预测DFT质量反应特性方面表现出色,接近化学精度。

在模型训练过程中,我们进行了有限的超参数搜索,并通过10折交叉验证评估模型性能。模型在ΔG?和ΔrG的预测上分别达到了1.19和1.72 kcal mol?1的平均绝对误差(MAE),以及1.73和2.33 kcal mol?1的均方根误差(RMSE)。相比之下,EquiReact等其他先进模型在相同数据集上的表现较差,MAE分别为3.20和4.09 kcal mol?1,RMSE分别为4.26和5.15 kcal mol?1。尽管如此,DeepReaction模型在数据效率方面表现突出,能够在有限的计算成本下达到接近DFT精度的预测结果。

为了进一步扩展反应搜索空间,我们引入了一个快速但精度较低的基于图的ML模型,即ChemProp。该模型通过反应SMILES字符串进行训练,生成Condensed Graphs of Reaction(CGR),并利用定向信息传递神经网络进行预测。在训练过程中,ChemProp模型的预测误差分别为2.21和2.60 kcal mol?1,但仍能捕捉到一定的反应趋势,R2值分别为0.89和0.94。尽管其精度不如DeepReaction模型,但ChemProp在筛选大规模反应空间方面具有显著优势,特别是在初步筛选和扩展反应空间时。

在实际应用中,我们通过ChemProp模型对新生成的反应空间进行了初步筛选,随后利用DeepReaction模型进行精炼。通过这种方式,我们不仅能够快速扩展反应空间,还能在有限的计算资源下筛选出具有自修复潜力的反应。例如,在扩展后的反应空间中,我们生成了15,889个新的DA反应,其中4245个被ChemProp模型预测为潜在适用反应。随后,我们对这些反应进行xTB和DFT计算,最终筛选出32个最具有潜力的反应进行最终验证。

在对反应能垒和反应自由能的分析中,我们发现大多数反应的ΔG?和ΔrG值分布较为集中,尤其是在xTB和DFT水平上。值得注意的是,ΔrG值通常在-20到0 kcal mol?1之间,表明这些反应具有良好的热可逆性。此外,ΔG?值大多在30到40 kcal mol?1之间,这意味着这些反应在加热时能够逆转,从而实现自修复。然而,ΔG?值低于30 kcal mol?1的反应在数量上相对较少,仅占总反应空间的约16%。

为了进一步提高筛选效率,我们还对反应空间进行了更严格的筛选,排除了可能经历酮-烯醇互变异构、含有易水解结构或存在竞争分子内DA反应的反应。这些筛选步骤确保了所选反应在合成过程中具有较高的可行性。经过筛选后,仍有1288个反应被保留下来,其中一些代表性的反应在图6C中展示。

此外,我们还探索了从ZINC NP数据库中挖掘可能的生物基DA反应。ZINC NP是一个包含76,615种商业可用天然产物的数据库,具有丰富的化学多样性。通过筛选该数据库,我们识别出84种潜在的二烯和423种潜在的亲二烯体,生成了308,261个DA反应。尽管这些反应在化学多样性方面表现出色,但它们的活化能垒主要集中在25-30 kcal mol?1之间,表明仅靠生物基反应可能难以实现超低温度下的自修复性能。因此,我们建议结合合成反应空间和生物基反应空间,以提高自修复聚合物的性能和适用性。

通过这种分层ML与计算化学相结合的方法,我们成功地构建了一个高效、数据驱动的DA反应筛选流程。该方法不仅显著降低了筛选成本,还提高了预测的准确性。我们相信,这一方法为自修复聚合物的设计提供了新的思路,并有望在未来应用于其他类型的化学反应筛选。此外,我们还公开了所有相关的模型、数据集和代码,以便其他研究者能够借鉴和扩展这一方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号