
-
生物通官微
陪你抓住生命科技
跳动的脉搏
具有多维描述符的屏障平衡机器学习框架,用于可解释地筛选仲胺离子液体催化剂
《ACS Catalysis》:Barrier-Balancing Machine Learning Framework with Multidimensional Descriptors for Interpretable Screening of Secondary Amine Ionic Liquid Catalysts
【字体: 大 中 小 】 时间:2025年11月03日 来源:ACS Catalysis 13.1
编辑推荐:
催化剂筛选中的能垒平衡与机器学习模型构建,基于Sabatier原理和速率控制理论,整合密度泛函理论计算与实验验证,以曼尼希反应合成长甲基丙烯林为例,通过SHAP可解释性分析揭示关键物理化学参数对双反应步骤能垒的影响机制,建立包含物化性质、分子指纹和量子化学特征的多维描述符库,验证了模型预测性能与实验结果的高相关性,为复杂均相催化系统提供可解释的筛选工具。

在多步反应系统中,均相催化剂的合理筛选与设计仍然是一个核心挑战,尤其是当多个基元步骤的活化能垒相当且较高时。受Sabatier原理和速率控制理论的影响,我们提出了一个基于机器学习的障碍平衡框架,该框架侧重于通过密度泛函理论计算和实验验证来协调而非最小化各个能量垒,从而识别高效的仲胺离子液体催化剂。以Mannich反应合成甲基丙烯醛为例,我们关注了两个具有动力学意义的步骤:亲核攻击甲醛(ΔE1)和中间体的分解(ΔE2),并将这两个步骤的能量垒中的较大值作为模型的训练目标。我们构建了一个具有物理解释能力的多维描述符库,该库整合了基于物理化学的性质、Morgan指纹图谱、基于体积的立体参数以及量子化学特征。通过SHapley Additive exPlanations(SHAP)方法对训练得到的随机森林模型进行解释,从而识别出控制能量垒高度的关键描述符。基于模型预测得出的障碍评分指标与实验选择性之间存在强相关性,这验证了该框架的物理合理性和预测能力。该框架不仅能够根据电子环境区分芳基和烷基取代的胺类,还为复杂均相系统中的催化剂筛选提供了一个可解释且具有普遍适用性的工具。
生物通微信公众号
知名企业招聘