
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多智能体协同驱动的电化学氮还原催化剂结构-活性关系自动化分析新范式
【字体: 大 中 小 】 时间:2025年09月05日 来源:National Science Review 17.1
编辑推荐:
针对电化学氮还原反应(eNRR)中结构-活性关系(SARs)解析难题,研究人员开发了集成大语言模型(LLM)与机器学习的多智能体框架eNRRCrew。通过分析2,321篇文献构建催化剂数据库,建立随机森林分类器预测NH3产率,揭示空间群数、电负性差等关键因子。该系统实现新型催化剂推荐与性能预测,为可持续氨生产提供智能化设计平台。
氨作为重要的化工原料和能源载体,其传统Haber-Bosch生产工艺消耗全球1%-2%能源并产生大量CO2排放。电化学氮还原反应(eNRR)被视为绿色替代方案,但面临Faradaic效率(FE)低、NH3产率不足等挑战,核心瓶颈在于催化剂结构-活性关系(SARs)的复杂性和文献数据的碎片化。传统方法依赖试错实验或密度泛函理论(DFT)计算,前者效率低下,后者难以模拟真实电化学环境。
为解决这一难题,Xu Hu团队在《National Science Review》发表研究,开发了名为eNRRCrew的多智能体协作框架。该系统整合LLM、知识图谱和机器学习算法,通过分析2,321篇文献摘要构建了包含催化剂组成、反应条件和性能指标的数据库。研究采用随机森林分类器预测产率,SHAP分析揭示空间群数和元素电负性差等关键描述符,聚类技术识别FE模式,最终实现新型催化剂的智能推荐与性能预测。
关键技术方法包括:1) 基于ChemPrompt的LLM文本挖掘技术从文献提取结构化数据;2) Magpie描述符生成和特征工程构建159维特征空间;3) 随机森林分类器与Optuna超参数优化实现产率预测;4) 层次聚类分析FE数据模式;5) 基于AutoGen框架构建包含协调器、预测器和知识检索器的多智能体系统。
文本挖掘与LLM应用
通过GPT-4o与ChemPrompt结合,从文献中提取催化剂组成、结构特征和性能指标,平均F1-score达0.96。

机器学习模型构建
随机森林分类器对NH3产率预测的测试集F1-score为0.63,SHAP分析显示空间群数小、弱酸性Na2SO4电解质等特征促进高产率。

Faradaic效率分析
聚类发现第3类催化剂FE显著优于其他组,价电子数和原子质量是关键影响因素。

eNRRCrew系统应用
五智能体架构实现自然语言交互,成功推荐Mo-W/Ti2NO2MXene等新型催化剂,AIMD模拟验证其稳定性。

该研究创立了LLM驱动电催化研究的新范式,eNRRCrew框架可扩展至OER等反应体系。通过揭示空间群数、电负性差等关键描述符,为理性设计高性能eNRR催化剂提供理论依据。实验验证推荐的MoFeNC催化剂证实系统预测可靠性,其模块化架构为加速材料发现提供了通用平台。
生物通微信公众号
知名企业招聘