基于二进制鲸鱼优化（Binary Whale Optimization）和灰狼优化（Grey Wolf Optimization）算法的DNN-XGBoost框架，用于二氧化碳排放预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Sustainable Computing: Informatics and Systems》：DNN-XGBoost Framework for CO 2 Emissions Prediction Based on Binary Whale Optimization and Grey Wolf Optimization Algorithms

【字体：大中小】 时间：2026年03月26日 来源：Sustainable Computing: Informatics and Systems 3.8

编辑推荐：

　　二氧化碳排放预测采用DNN-XGBoost混合框架，结合BWO特征选择和GWO超参数优化，数据预处理使用Z-score标准化并划分为70%-15%-15%训练-验证-测试集。实验表明GWO-DNN-XGBoost模型在MSE、MAPE等指标上最优（R2=99.28%），经t检验和ANOVA验证显著优于其他模型。

艾哈迈德·M·埃尔谢韦

计算机科学系，计算机与信息学院，苏伊士大学，邮政信箱：43221，苏伊士，埃及

摘要

二氧化碳（CO₂）排放是全球气候变化的主要因素，其产生源于人类活动，如化石燃料的燃烧和工业过程。准确预测CO₂排放对于制定有效的缓解策略和支持可持续发展计划至关重要。本研究提出了一种名为深度神经网络与极端梯度提升（DNN-XGBoost）的新框架，用于CO₂排放预测。这种集成方法能够有效建模数据中的复杂非线性关系。本研究使用的数据集经过Z分数标准化预处理，并分为70%用于训练、15%用于验证和15%用于测试。二进制鲸鱼优化（BWO）算法被用于特征选择。将BWO算法的性能与其他二进制格式的优化算法进行了比较，在平均误差、平均适应度、最佳适应度和最差适应度方面，BWO算法取得了最佳结果。灰狼优化（GWO）算法被用于所提出的DNN-XGBoost模型和其他基本机器学习回归模型的超参数调整。实验结果表明，GWO与DNN-XGBoost模型的组合性能优于GWO与其他基本回归模型的组合。为了验证GWO与DNN-XGBoost模型的强大性能，还使用了其他优化算法对DNN-XGBoost模型进行了调整。GWO-DNN-XGBoost模型在所有优化算法中表现最佳，R²得分为99.28%。统计分析（包括配对t检验和方差分析）被用来评估实验结果的意义。

引言

二氧化碳（CO₂）排放的持续增加是一个严重且持续的环境问题[1]。作为全球气候变化的主要贡献者，这些排放主要是由于人类活动造成的，包括化石燃料的燃烧、大规模的森林砍伐、快速的工业扩张以及交通运输业的增长[2]。这些排放不仅导致全球气温上升，还对生态系统、经济和公共卫生产生了广泛的影响[3]。二氧化碳水平上升的影响远远超出了大气的变化[4]。它们推动了全球变暖，加速了极地冰层的融化，增加了海平面的上升，并加剧了天气事件的强度和频率[5]。这些干扰也对世界各地的生态系统产生了严重影响[6]。因此，粮食安全、人类健康、经济稳定性和水资源可用性都面临风险。鉴于这些广泛的后果，准确预测和管理CO₂排放已成为科学家、政策制定者和致力于保护地球未来的环保组织的重要任务[7]。考虑到这些挑战，准确预测CO₂排放对于制定政策决策、制定环境战略和推进可持续发展目标变得越来越重要[8]。近年来，人工智能（AI）、机器学习（ML）和优化技术的重大进展改变了包括环境科学在内的各个领域的预测建模格局[9]。这些技术提供了强大的工具，可以通过识别隐藏的模式并高精度地预测未来趋势来分析复杂的数据集[10]。传统的统计方法往往难以捕捉复杂的非线性模式并有效管理高维数据集。因此，混合学习和集成学习模型因其能够整合多种算法的优势而受到越来越多的关注，从而提高了预测准确性和模型的泛化能力[11],[12]。尽管基于ML的CO₂排放预测模型取得了显著进展，但在处理高维特征空间、优化模型参数和捕捉各种影响因素之间的非线性依赖关系方面仍存在挑战[13],[14]。大多数传统模型难以在预测准确性和计算效率之间取得平衡。特征选择和超参数优化在模型性能中起着关键作用，但它们经常被忽视或处理不当[15]。因此，需要一个强大且适应性强的预测框架，能够智能地提取相关特征、微调模型参数，并有效捕捉CO₂排放的潜在动态[16]。为了解决这些限制，本研究提出了一种名为深度神经网络与极端梯度提升（DNN-XGBoost）的新混合框架，用于CO₂排放预测。所提出的模型结合了DNN的特征学习能力和XGBoost的预测能力。DNN非常适合从原始输入数据中自动学习复杂的表示，特别是在处理大型和非线性数据集时。另一方面，XGBoost是一种高效且可扩展的梯度提升技术，在结构化数据预测任务中表现出色。所提出的DNN-XGBoost框架的新颖之处不仅在于其混合架构，还在于使用了两种受自然启发的优化算法：二进制鲸鱼优化（BWO）用于特征选择和灰狼优化（GWO）用于超参数调整。这些算法分别模仿了鲸鱼和灰狼的社会行为和狩猎策略，并因其全局搜索能力和快速收敛而广受认可。通过在建模过程中整合BWO和GWO，该框架有效减少了特征冗余，提高了模型的可解释性，并增强了预测性能。本研究的主要贡献可以总结如下：•

开发了一种混合DNN-XGBoost框架，用于预测CO₂排放，有效结合了深度神经网络（DNN）在捕捉复杂模式方面的优势和极端梯度提升（XGBoost）在处理结构化数据和减少过拟合方面的优势。

•

数据预处理包括应用Z分数标准化来规范特征尺度，确保特征贡献均衡并促进模型更快收敛。

•

数据集被划分为三个不同的子集：70%用于训练，15%用于验证，15%用于测试，以确保模型评估的稳健性并防止过拟合。

•

采用二进制鲸鱼优化（BWO）进行有效的特征选择，旨在降低数据维度同时保持高预测准确性。为了评估其性能，将BWO与其他二进制优化技术（包括二进制粒子群优化（BPSO）、二进制遗传算法（BGA）和二进制萤火虫算法（BFA）进行了比较。在这些算法中，BWO在平均误差、平均适应度、最佳适应度和最差适应度等关键性能指标上表现最佳。

•

利用灰狼优化（GWO）对所提出的DNN-XGBoost模型和其他基本机器学习回归模型（包括梯度提升（GB）回归器、随机森林（RF）回归器、决策树（DT）回归器、支持向量（SV）回归器和K-最近邻（KNN）回归器）进行超参数调整。GWO-DNN-XGBoost在所有模型中表现最佳。

•

为了确保GWO-DNN-XGBoost模型的性能，还使用其他优化算法对其进行了优化，即均值方差优化（MVO）、猎鹰优化算法（FOA）和广度优先搜索（BFS）。GWO-DNN-XGBoost取得了最佳结果，优于MVO-DNN-XGBoost、FOA-DNN-XGBoost和BFS-DNN-XGBoost。

•

评估指标包括均方误差（MSE）、平均绝对误差（MAE）、中位数绝对误差（MedAE）、平均绝对百分比误差（MAPE）和决定系数（R²）。

•

GWO-DNN-XGBoost模型取得了最佳性能，MSE为0.0095，MAPE为0.0114，MedAE为0.0670，R²得分为99.28%，计算时间为3.264秒。

•

统计分析（包括方差分析和配对t检验）表明，所提出的GWO-DNN-XGBoost模型显著优于其他模型。方差分析结果显示F统计量很高（8.90），p值非常低（< 0.0001），表明模型性能之间存在显著差异。将GWO-DNN-XGBoost与GWO-KNN进行比较的配对t检验的p值低于0.0001，提供了该模型预测准确性更优的强有力证据。

•

使用Shapley加性解释（SHAP）来解释模型的预测结果。燃料消耗（组合、城市和高速公路）被认为是最具影响力的因素，当其值较高时，CO₂预测值显著增加。发动机排量也有正面贡献，而气缸数量的影响较小但一致。这一可解释的见解阐明了模型的决策过程，并为实际干预提供了信息。

本文的其余部分组织如下：第2节介绍了相关文献。第3节详细描述了所提出的方法。第4节展示了实验结果并进行了全面讨论。第5节总结了研究并提出了未来研究的潜在方向。

方法论

本研究提出了一种名为DNN-XGBoost的新混合预测框架，用于准确预测CO₂排放。所提出的方法利用了DNN强大的特征提取能力和XGBoost模型的卓越回归性能。DNN组件由多个全连接层组成，旨在捕捉复杂的非线性模式并从输入特征中提取高层次的表示。XGBoost组件接收中间输出

结果与讨论

本研究的实验实现使用了Jupyter Notebook 7.2.1版本，这是一个广泛用于数据分析、模型开发和Python可视化平台。Jupyter提供了一个交互式且用户友好的环境，用于编写、执行和记录代码，以及生成视觉输出。所有实验都在基于Web的界面中进行，使用的是Python 3.10版本。计算环境包括Microsoft Windows 10操作系统

结论与未来工作

本文提出了一种名为DNN-XGBoost的新混合框架，用于准确预测CO₂排放，通过集成二进制鲸鱼优化（BWO）进行特征选择和灰狼优化（GWO）进行超参数调整来增强性能。所提出的框架有效结合了深度神经网络的深度特征提取能力和XGBoost模型的强大回归能力，从而实现了卓越的预测性能。比较实验表明

资助

本研究没有从公共、商业或非营利部门的资助机构获得任何特定资助。

作者声明

我声明本手稿是原创的，之前未发表过，目前也没有考虑在其他地方发表。

我已经阅读并批准了手稿的最终版本，并同意将其提交给《可持续计算：信息学与系统》期刊。

我理解通讯作者是编辑过程的唯一联系人。他负责与期刊沟通、提交修订稿和最终批准校样。

作者贡献声明

艾哈迈德·M·埃尔谢韦：撰写——审稿与编辑，撰写——初稿，可视化，验证，监督，软件，资源，项目管理，方法论，调查，形式分析，数据整理，概念化。

利益冲突声明

作者声明没有利益冲突。

联系信箱：

粤ICP备09063491号

摘要

引言

相关工作

相关研究

方法论

结果与讨论

结论与未来工作

资助

作者声明

作者贡献声明

利益冲突声明

热点排行