基于可解释机器学习的碳水化合物生物质水热转化制甲酸预测与环境影响评估
《Biomass and Bioenergy》:Prediction of hydrothermal conversion of carbohydrates biomass into formic acid using interpretable machine learning
【字体:
大
中
小
】
时间:2025年10月16日
来源:Biomass and Bioenergy 5.8
编辑推荐:
本研究针对碳水化合物生物质水热转化制甲酸(FA)过程中关键因素影响量化困难、实验优化成本高的问题,开展了基于可解释机器学习(ML)的预测模型构建与生命周期评估(LCA)研究。结果表明,极端梯度提升(XGBoost)模型预测性能最优(测试集R2=0.80),准确识别了反应时间、碱催化剂浓度等关键影响因素。LCA进一步揭示MgO催化剂相比均相催化剂(NaOH/KOH)具有更低的全球变暖潜能值(GWP)。该研究为可持续FA生产提供了数据驱动的新策略。
随着化石能源的过度使用导致严重的环境问题和能源危机,近几十年来对可再生和环境友好型化学品的需求不断增加。甲酸(FA)作为一种无腐蚀性、无毒的化学品,广泛用于皮革、染料、医药和橡胶的制造,并可作为氢储存介质。2020年,全球FA市场估计约为60万吨,预计2021年至2026年的增长率为3%。碳水化合物生物质因其成本效益、环境友好性、可再生性和碳中和特性,在替代一氧化碳、甲醇和甲烷等传统原料生产FA方面显示出巨大潜力。与生物发酵和热解等其他生物质转化技术相比,水热转化特别具有吸引力,它利用高温水(200–600 °C)作为反应介质,其独特的性质有助于关键化学反应,无需深度干燥即可直接处理原始生物质。
然而,碳水化合物生物质水热转化为FA是一个复杂的过程,产率对反应条件高度敏感。量化关键因素对FA产量的影响及其环境 implications 仍然是一项费力且昂贵的工作。传统的热力学和动力学模型由于模型推导和参数量化的局限性,准确预测FA产率仍然存在问题。此外,使用O2或H2O2作为氧化剂与不同催化剂的反应机理和关键因素仍不清楚,需要深入研究。确定最大化FA产率的最佳工艺设计也很困难,因为实验优化耗时、费力且成本高。
为此,发表在《Biomass and Bioenergy》上的这项研究,由海南大学的Genmao Guo和Fangming Jin完成,旨在应用机器学习(ML)技术模拟碳水化合物生物质水热转化为FA的过程,目标是开发高效的预测模型,并进行生命周期评估(LCA)以评估环境影响。
研究人员主要运用了几项关键技术方法:首先,从已发表的关于纤维素和葡萄糖水热转化生产FA的研究中收集数据,构建包含238个数据点的数据集,输入因素包括反应温度、时间、水量、生物质量、催化剂用量、氧化剂浓度/压力等,目标变量为FA产率。其次,评估了八种机器学习算法(四种传统模型如线性回归(LR)、支持向量回归(SVR)等,以及四种集成模型如随机森林(RF)、极端梯度提升(XGBoost)等)的预测性能,并通过网格搜索进行超参数优化。第三,利用排列重要性、SHAP(Shapley Additive Explanations)分析和偏依赖图(PDPs)等可解释性方法量化因素贡献并阐明其非线性效应。最后,遵循ISO 14040和14044标准,使用SimaPro软件和CML-IA基线方法对均相催化剂(NaOH, KOH)和多相催化剂(MgO)进行生命周期评估(LCA),比较其环境 impacts,功能单位为生产1 kg FA。
对原始数据进行描述性统计分析显示,FA产率的中位值为29.6%,范围从1.06%到89.14%。反应条件参数变化范围较大。皮尔逊相关系数(PCC)分析表明,大多数特征对之间的相关性较低(|PCC| < 0.7),可共同用于建模。FA产率与反应时间和碱催化剂浓度呈显著正相关,而与反应温度和O2压力呈显著负相关。
通过比较八种机器学习模型,发现集成模型,特别是XGBoost,实现了最高的预测精度。XGBoost模型在训练集上R2为0.84,在测试集上R2为0.80,均方根误差(RMSE)为11.0,平均绝对误差(MAE)为8.4,性能优于其他模型。SHAP分析确定反应时间、碱催化剂浓度、H2O2浓度和反应温度是对FA产率影响最大的因素。
分别对使用H2O2和O2作为氧化剂的数据集评估四种集成方法。对于H2O2氧化剂,XGBoost模型在训练和测试集上均表现最佳(R2分别为0.84和0.83)。对于O2氧化剂,XGBoost模型同样显示出优越的预测性能(训练和测试集R2均超过0.84)。
收集60个实验数据点(各30个用于H2O2和O2氧化剂)验证最优XGBoost模型。结果表明,大多数预测值与实验值之间的相对误差在20%的阈值内,表明模型具有良好的预测有效性。
基于SHAP方法进一步分析特征重要性。对于H2O2氧化剂,碱催化剂浓度、反应时间、H2O2浓度和反应温度是最有影响力的因素,其中前三者呈正效应,反应温度呈负效应。对于O2氧化剂,重要性顺序为反应时间 > 反应温度 > 多相催化剂用量 > O2压力。
3.6. 通过PDPs分析H2O2存在下工艺参数对FA产率的交互影响
偏依赖图(PDPs)分析揭示了关键参数与FA产率之间的非线性关系。例如,H2O2浓度增至150%可显著提高FA产率,但进一步增加效果不显著。碱催化剂浓度在2 mol/L以下时与FA产率呈近线性正相关。反应温度在50-150°C范围内升高会导致FA产率下降。双因素PDPs显示了变量间的交互作用,如碱催化剂浓度和H2O2浓度在特定范围内组合时对FA产率有协同促进作用。
3.7. 通过PDPs分析O2存在下工艺参数对FA产率的交互影响
对于O2氧化剂,FA产率随反应温度(50-250°C)升高而持续增加,在250-300°C趋于稳定。反应时间在2-6小时内增加可有效提高FA产率,但超过7-8小时则可能下降。O2压力在1-3 MPa范围内增加对FA产率有提升作用。
3.8. 通过KOH、NaOH和MgO催化剂生产FA的LCA分析
SHAP分析表明,催化剂类型对FA产率有重要影响,重要性顺序为NaOH > H2O2 > KOH > MgO。LCA结果显示,使用MgO催化剂生产1 kg FA的全球变暖潜能值(GWP)为3.78 kg CO2 eq.,低于NaOH催化剂(4.47 kg CO2 eq.)和KOH催化剂(13.8 kg CO2 eq.)。终点评估(人类健康、生态系统、资源)也表明MgO催化剂的环境影响(198.5 mPt)显著低于NaOH和KOH催化剂。H2O2用量和催化剂用量是GWP影响的主要贡献者,其中MgO催化剂相关的GWP影响最低。
本研究成功评估了多种机器学习方法在预测碳水化合物生物质水热转化制甲酸产率方面的应用,确定XGBoost为最优模型。通过可解释性分析(如SHAP和PDPs)深入揭示了关键工艺参数(如氧化剂类型、催化剂种类、反应条件)对FA产率的复杂影响机制。结合生命周期评估(LCA),明确指出了采用多相催化剂MgO相较于传统均相催化剂(NaOH, KOH)在环境可持续性方面的优势,其全球变暖潜力(GWP)显著降低。这项工作不仅为优化FA生产提供了高效、准确的预测工具和数据驱动的见解,而且从全生命周期角度评估了工艺的环境 footprint,为推进生物质资源绿色转化和高值化利用 towards 碳中和目标提供了重要的理论依据和实践指导。未来研究应侧重于扩大数据集、探索更先进的建模方法,并进行更全面的可持续性评估,以促进甲酸生产的工业化进程。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号