基于可解释人工智能(Explainable AI)的设计规则,用于将合成气通过钴基催化剂转化为5种以上的液体燃料

《Journal of Energy Chemistry》:Explainable AI-driven design rules for syngas-to-C 5+ liquid fuels over cobalt catalysts

【字体: 时间:2025年09月19日 来源:Journal of Energy Chemistry 14.9

编辑推荐:

  液态燃料通过合成气转化制备可缓解能源危机并助力碳中和,但过程受原料特性、催化剂性能及反应条件等多因素影响。本研究构建基于236组文献数据的机器学习模型,预测CO转化率与C5+选择性,揭示反应温度(<240℃)和钴负载量(约20%)对产物分布的关键作用,纳米级钴颗粒(<6 nm)因促进甲烷生成和活性位点失稳而降低C5+选择性。模型采用可解释性分析(SHAP、PI、PDP)解析参数交互效应,为催化剂优化提供理论指导。

  液态燃料的生产在现代社会中扮演着重要角色,特别是在交通运输领域,包括航空和汽车应用。随着全球对碳中和目标的承诺不断加深,以及环境问题日益受到关注,寻找可持续的替代液态燃料生产路径变得愈发紧迫。合成气(syngas)是一种由生物质和城市废弃物转化而来的混合气体,主要成分包括一氧化碳(CO)和氢气(H?),它可以通过费托合成(Fischer-Tropsch synthesis, FTS)转化为多种碳氢化合物。FTS作为一种具有潜力的废物资源化技术,不仅能够缓解能源供应紧张的问题,还能生产高附加值的燃料(C??)。然而,这一过程受到多种因素的共同影响,如原料特性、催化剂性能和反应条件,这些因素之间的复杂相互作用使得优化过程变得极具挑战性。

为了更有效地进行过程优化,研究团队开发了一种基于机器学习(Machine Learning, ML)的模型,用于预测CO的转化率和C??的选择性。该模型基于关键输入特征进行构建,从现有文献中收集了236组数据,为后续的数据挖掘和模型训练提供了坚实的基础。通过对这些数据的分析,研究发现,较低的反应温度(<240°C)和适中的钴负载量(约20%)有助于提高C??的选择性。然而,过小的钴颗粒(<6 nm)却会对C??的选择性产生负面影响,这主要是由于纳米尺度下甲烷的形成增加以及活性位点的稳定性下降所致。

机器学习作为一种人工智能的重要分支,在计算机科学领域发挥着关键作用,特别是在数据分析和预测建模方面。它已被广泛应用于能源转换过程,如催化反应、可再生能源优化和燃料合成等领域。近年来,越来越多的研究开始探索如何将机器学习应用于FTS过程,以提升预测精度并减少实验成本。例如,Liu等人利用机器学习揭示了CO在FTS过程中的活化机制,指出CO的活化发生在表面碳空位位置,这一发现为理解催化剂性能提供了新的视角。此外,研究还确认了机器学习与密度泛函理论(Density Functional Theory, DFT)结合的可能性,这种结合可以更全面地揭示催化反应的微观机制。

Motaev等人则采用决策树方法构建了一个包含169组数据和16个特征参数的模型,成功预测了FTS的目标特性。Chakkingal等人则专注于开发人工神经网络(Artificial Neural Network, ANN)模型,以预测FTS过程中甲烷的形成情况。这些研究展示了机器学习在FTS产品预测中的广泛应用,但同时也暴露出当前模型在预测精度方面的局限性。由于FTS过程本身具有高度的复杂性和强非线性特征,传统的预测模型往往难以全面捕捉这些变量之间的关系,导致预测结果不够理想。

神经网络(Neural Network, NN)在处理这类复杂问题方面展现出独特的优势。相比其他常见的机器学习方法,如极端梯度提升(Extreme Gradient Boosting, XGBoost)和最近邻回归(Nearest Neighbor Regression),神经网络通常能够实现更高的预测精度和更强的鲁棒性。神经网络的设计灵感来源于生物神经系统的结构,它通过大量相互连接的神经元学习数据中的模式。这一特性使得神经网络能够在没有明确物理化学机理知识的情况下,依然能够有效地捕捉反应过程中的复杂关系,从而提高模型的泛化能力。

在FTS研究中,已有部分团队尝试将神经网络应用于轻质烯烃(C?–C?)的合成过程,重点分析了活性相组成和操作条件对产物分布的影响。此外,他们还建议在模型中引入诸如催化剂比表面积、颗粒尺寸和气体时空速度(GHSV)等变量,以增强模型的稳健性。然而,对于多碳产物的预测,尤其是C??的选择性和CO的转化率,现有的神经网络研究仍然较为有限。部分研究虽然尝试将神经网络与遗传算法结合,但主要聚焦于C?产物(如CH?、CO?和CO)的预测,而未能全面覆盖多碳产物的生成情况。此外,一些研究仅针对铁基催化剂的甲烷选择性进行建模,忽略了钴基催化剂在这一过程中的独特表现。

因此,开发一种能够同时预测CO转化率和C??选择性的多输出神经网络模型,对于钴基FTS的研究具有重要意义。在本研究中,团队通过系统收集和整理现有文献中的数据,构建了一个全面的数据集,用于训练和开发神经网络模型。通过对关键输入特征的选择以及模型解释方法的应用,研究团队成功识别了影响CO转化率和C??选择性的主要因素。模型的优化过程涉及超参数调优,以确保其在预测任务中的准确性和稳定性。随后,研究团队进一步利用排列重要性(Permutation Importance, PI)、Shapley加法解释(Shapley Additive Explanations, SHAP)和部分依赖图(Partial Dependence Plot, PDP)等解释方法,对输入特征与输出变量之间的关系进行了深入分析。

这些解释方法不仅能够揭示单个特征对模型输出的影响,还能分析特征之间的相互作用。例如,通过PI分析,研究团队可以确定哪些特征对CO转化率和C??选择性的预测贡献最大;通过SHAP分析,可以进一步理解每个特征对模型预测结果的贡献程度及其方向;而PDP则有助于展示特征变化对输出变量的影响趋势。这些分析结果为实验研究提供了重要的理论指导,使得研究人员能够在不进行大量实验的前提下,更精准地识别影响催化性能的关键因素。

此外,本研究还强调了数据驱动方法在催化研究中的重要性。传统的催化剂优化方法通常依赖于实验测试,这不仅耗费大量的人力和物力资源,还可能因为实验条件的限制而难以全面覆盖所有可能的影响因素。相比之下,数据驱动的方法能够通过系统的数据挖掘和建模,更高效地识别关键变量,并提供更可靠的预测结果。这种方法特别适用于那些具有高度非线性关系和复杂相互作用的反应系统,如FTS过程。

为了确保研究的透明性和可重复性,团队采用Scopus和Google Scholar等数据库进行了系统性的文献检索。检索过程中,使用了包含“Fischer-Tropsch”、“cobalt”、“syngas”、“C??”等关键词的组合查询,以确保涵盖相关研究的全面性。此外,研究团队还对收集到的数据进行了系统的处理和筛选,以去除不完整或不可靠的信息,从而提高模型训练的质量和效率。

通过本研究的模型构建和验证,团队发现神经网络在预测CO转化率和C??选择性方面表现出色,其在独立测试数据集上的R2值约为0.81。这一结果表明,神经网络能够有效捕捉FTS过程中复杂的非线性关系,并提供可靠的预测。同时,模型解释方法的应用也显著提升了模型的可解释性,使得研究人员能够更好地理解模型预测结果背后的物理化学机制。

综上所述,本研究通过构建和训练一个基于神经网络的预测模型,成功实现了对钴基FTS过程中CO转化率和C??选择性的准确预测。同时,通过引入模型解释方法,研究团队不仅提高了模型的预测性能,还为实验研究提供了有价值的理论指导。这些成果对于推动FTS技术的工业化应用具有重要意义,同时也为未来的研究方向提供了新的思路。未来的研究可以进一步探索多输出神经网络模型在不同催化剂体系中的适用性,以及如何通过更精细的特征选择和模型优化,提高预测的准确性和泛化能力。此外,还可以结合其他先进的数据挖掘和机器学习技术,以更全面地揭示FTS过程中的复杂机制,从而为可持续能源开发提供更加坚实的理论基础和技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号