《Sustainable Computing: Informatics and Systems》:The Implementation of Machine Learning Models for Predicting CO
2 Emission in Carbon Capture and Storage Systems
编辑推荐:
碳捕获与封存系统二氧化碳排放预测研究采用六种机器学习模型(逻辑回归、决策树、随机森林等)进行优化,通过网格搜索和混合开普勒算法确定最佳模型。结果表明XGBoost模型表现最优,测试集MAE为47.5,R2达0.9879,并实现高精度预测(A20≥72%)和低不确定性(U95)。重要预测因子为“气”和“活动”,为CCS系统优化、环境风险控制及投资决策提供技术支撑。
Zixiang Xu|Xiaokai Zhou|Yishan Wang
北京交通大学交通与运输学院,中国北京,100044
摘要
尽管碳捕获与封存(CCS)系统对于减少全球二氧化碳(CO2)排放至关重要,但其操作复杂性以及性能因素的波动性使得难以预测这些系统内的排放水平。这一问题非常重要,因为它直接关系到提高CCS效率、降低环境风险以及指导与气候缓解相关的投资和政策选择。本研究使用了六种机器学习(ML)模型:逻辑回归(LR)、决策树(DT)、随机森林(RF)、梯度提升(GB)、极端梯度提升(XGBoost)和分类提升(CatBoost),所有模型均通过GridSearchCV和混合开普勒优化算法(HKOA)进行优化,以解决这一问题,并为预测CCS系统内的二氧化碳排放提供了全面的框架。根据稳健性指标的结果,经过HKOA优化的XGBoost模型表现最佳,其误差率最低(训练集MAE = 22.6,测试集MAE = 47.5;RMSE = 42.1,测试集RMSE = 196.0),R2值分别为0.9994(训练集)和0.9879(测试集),目标函数(OBJ)值在测试集为15385.2。此外,该模型还实现了较高的A20准确率(≥72%)和较低的不确定性指数(U95),这表明其具有很强的泛化能力且在不确定性条件下偏差最小。“气体”和“活动”通过SHAP和特征重要性分析被确定为重要预测因子。这些结果不仅展示了基于树的集成模型在预测排放方面的有效性,还为CCS规划、监测和优化提供了实用工具,有助于制定更加可持续和盈利的碳管理计划。
部分摘录
术语表
- LR
线性回归
- DT
决策树
- RF
随机森林
- GB
梯度提升
- XGBoost
极端梯度提升
- CatBoost
分类提升
- CCS
碳捕获与封存
- CO2
二氧化碳
- ML
机器学习
- ANN
人工神经网络
- CNN
卷积神经网络
- SVR
支持向量回归器
- KNN
K最近邻
- LSTM
长短期记忆
- RMSE
均方根误差
- R2
相关系数
- MAE
平均绝对误差
- MSE
均方误差
- A20
预测值与真实值相差±20%内的百分比
- U95
95%的不确定性
方法论
本研究探讨了一种结合机器学习技术的方法,以更准确地预测CCS系统的二氧化碳排放性能。这类预测模型的主要目标是为决策者提供有关进一步优化CCS配置和策略的广泛见解。通过提供准确的情景结果估计,这些模型可以找到最有效且成本效益最高的CCS系统实施方式。
模型评估结果
比较不同模型是开发或选择任何机器学习算法的关键环节之一。本文对多种模型进行了评估,以确定哪种模型在预测CCS系统排放量方面最为有效。通过比较不同模型的性能,可以得出更真实的结论,从而提高机器学习在可靠应用中的可行性。在本研究中,比较了逻辑回归(LR)、决策树(DT)、随机森林(RF)、梯度提升(GB)、极端梯度提升(XGBoost)和分类提升(CatBoost)等模型的表现。
结论
本研究提出了一个全面的机器学习(ML)框架,用于预测碳捕获与封存(CCS)系统中的二氧化碳排放量,旨在提升系统优化效果并减少环境影响。针对CCS面临的一系列挑战(如高资本成本、能源消耗以及系统级优化的需求),本研究利用先进的机器学习模型来克服预测局限性和操作效率低下问题。
作者贡献声明
Yishan Wang:软件开发、方法论设计。Xiaokai Zhou:数据分析、数据整理。Zixiang Xu:初稿撰写、项目监督、概念构思。
利益冲突声明
作者声明在本研究的研发、作者身份及论文发表方面不存在任何潜在的利益冲突。