基于IBKA-CNN-BiLSTM-Attention模型的提前一天建筑负荷预测方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Electric Power Systems Research》：A day-ahead building load forecasting method based on IBKA-CNN-BiLSTM-Attention model

【字体：大中小】 时间：2026年02月16日 来源：Electric Power Systems Research 4.2

编辑推荐：

　　建筑能耗预测模型需解决非线性时序特征提取与多超参数组合优化难题。本文提出CNN-BiLSTM-Attention混合架构，采用改进黑猫算法（IBKA）优化六项关键超参数，在两个数据集上验证模型优势。实验表明IBKA优化组合的模型RMSE降低至0.282，MAE为0.317，R2达98.74%，且对夏/过渡/冬三季测试日均保持稳定预测性能，有效克服传统优化算法在离散混合参数搜索中的局限性。

冯增喜|朱正浩|葛航|韩朗|赵安军|权伟|薛晓

西安建筑科技大学建筑服务科学与工程学院，中国西安710055

摘要

预测建筑能耗对于提高能源效率和实现能源调度至关重要。然而，现有的能耗预测模型面临两个主要问题：（1）尽管一些建筑能耗预测模型表现出良好的预测性能，但在面对建筑负荷数据的复杂非线性和时间依赖特性时可能存在局限性。（2）现有研究主要关注不同预测模型之间的性能比较，对优化模型内部超参数组合的影响关注较少。因此，本研究提出了一种基于CNN-BiLSTM-Attention的混合预测模型，并通过改进的Black Kite算法（IBKA）进行优化。然后应用改进的IBKA在不同超参数组合下优化模型。仿真结果表明，通过IBKA算法优化的建筑能耗预测模型优于其他算法（如PSO或BWO）优化的模型。研究进一步表明，优化六个超参数（包括学习率、双向长短期记忆（BiLSTM）隐藏层的数量和最大迭代次数）可以提高预测精度。在数据集1上，与其它算法优化的模型相比，所提出的模型在相同的六个超参数配置下实现了更低的均方根误差（RMSE）和平均绝对误差（MAE），R2值为98.74%。此外，在数据集2上，该模型在夏季、过渡季节和冬季的测试日也表现出良好的预测性能，显示出可靠的预测能力。

引言

随着电气化的加速发展，预计2024年全球电力需求将显著增加[1]。根据联合国环境规划署（UNEP）和全球建筑与建设联盟[2]的数据，全球建筑行业仍然是气候危机的主要贡献者，占全球能源消耗的32%和二氧化碳排放的34%。一份报告[3]详细分析了全球能源需求和供应的关键趋势，指出2024年全球能源需求预计增长2.2%，其中电力需求增长4.3%，远高于全球GDP的3.2%增长率。此外，智能电网在管理能源需求、解决环境问题和确保能源安全方面发挥着重要作用。准确的能耗预测对于实现这些目标至关重要[4]。

目前主要有三种类型的建筑负荷预测模型。第一类是基于物理的模型，通常称为“白盒”模型。这些模型在准确识别不同建筑群体的最常见特征后，模拟代表性建筑[5]。第二类是灰盒模型。当只有部分系统信息可用时，我们将其称为灰箱系统[6]。最后，第三类是数据驱动模型。在这些模型中，主要使用时间序列统计分析和机器学习算法来预测建筑能耗[7]。这些模型通常被称为“黑盒模型”，它们不依赖于明确的物理机制，而是通过映射输入和输出数据之间的关系来进行建模。

现有的超参数选择方法可以分为手动搜索和自动搜索[8]。手动搜索通常旨在在运行时间和内存预算的限制下最小化泛化误差。然而，手动搜索依赖于专家知识且可重复性较差。为了解决这个问题，提出了自动搜索[9]。当超参数数量较少时，网格搜索是一种流行的超参数搜索方法。网格搜索的一个明显问题是，随着超参数数量的增加，处理负担呈指数级增长。为了缓解这一限制，引入了随机搜索作为一种更方便的方法，可以更快地收敛到一组好的超参数值[10]。

与传统和基于模型的优化方法相比，元启发式算法具有以下优势：强大的全局搜索能力，避免陷入局部最优解[11]；适用于离散和混合超参数[12]；不需要梯度信息，适用于黑盒优化[13]。

在过去十年中，人工智能技术的应用范围大幅扩展[14]。数据驱动方法使AI模型能够准确提取特征并预测能耗。表1列出了该领域的代表性机器学习研究。选择了三种监督式机器学习方法作为预测模型，并通过一个实际案例评估了不同模型的适用性[15]。此外，还提出了一种基于时空注意力（STA）、贝叶斯优化（BO）和LSTM的方法，证实了所提方法的有效性[16]。建筑能耗数据通常与时间相关，受到过去和未来特征的影响。因此，一些学者提出了结合DRN的梯度稳定性和BiLSTM的非线性时间建模能力的混合架构[17]。

多任务学习通过权重共享机制促进了任务之间的相互学习，从而有效解决了复杂问题[18]。为了提高模型的预测能力，许多学者结合多种模型形成新的混合预测模型[19]。为了模拟复杂的时间依赖性，一些学者结合了CNN和GRN[20]。尽管这些模型展示了显著的预测性能，但在利用先前数据中嵌入的关键信息方面仍存在局限性。因此，相关学者提出了MTL-CNN-BiLSTM预测模型，以克服时域分析预测精度的不稳定性[21]。

如表1所示，当前研究主要集中在应用不同的神经网络模型进行建筑能耗预测。无论模型类型如何，超参数的配置都是预测准确性的关键[22]。

当前的研究空白如下：

（1）LSTM和BiLSTM是建筑能耗预测研究中常用的模型。然而，基于LSTM的模型依赖于固定的结构来处理时间序列数据，难以有效提取关键局部特征。尽管BiLSTM可以通过双向信息流增强时间序列建模能力，但在训练过程中仍存在局部特征捕获不足或梯度消失等问题。

（2）目前大多数研究侧重于使用元启发式算法优化模型超参数，但通常只关注找到全局最优解，缺乏对不同超参数对模型影响的系统分析。

本研究的主要进展总结如下：

（1）通过Good Point Set（GPS）初始化、Golden Sine和差分进化（DE）机制优化的IBKA可以有效缓解BKA的过早收敛问题。

（2）IBKA被应用于优化CNN-BiLSTM-Attention模型的超参数，提高了模型的预测性能。

（3）研究评估了不同超参数配置对预测精度的影响。IBKA被用来优化CNN-BiLSTM-Attention模型的3到6个参数，确定了最佳超参数组合。

部分内容摘录

卷积神经网络（CNN）

卷积神经网络（CNN）[29]是一种深度学习架构。如图1所示，该网络主要由卷积层、池化层、全连接层和输出层组成。由于在特征提取方面的优越性能，CNN目前被广泛用于时间序列预测任务[30,31]。然而，由于模型架构和输入数据的限制，它们在从长时间序列数据中提取特征时存在局限性

数据来源

数据集的预处理步骤如下：（1）数据集分割：按照时间顺序将数据分为训练集和测试集，比例为8:2。测试集完全排除在模型训练过程之外，以确保训练数据和测试数据之间的严格分离，从而防止数据泄露；（2）数据集标准化：这一步包括不同数据集的清洗和标准化；（3）滑动窗口处理：将数据集划分为时间序列

结论

为了克服传统网络结构在特征提取方面的局限性，本研究提出了一种IBKA-CNN-BiLSTM-Attention办公楼负荷预测模型。此外，还应用IBKA优化了CNN-BiLSTM-Attention预测模型的不同超参数组合。研究分析了多种超参数组合对模型性能的影响。

实际结果表明：

(1)。

IBKA具有更强的全局搜索能力

CRediT作者贡献声明

冯增喜：撰写——审稿与编辑、监督、资源准备。朱正浩：撰写——初稿、验证、软件开发、方法论。葛航：方法论、数据整理。韩朗：验证、资源准备。赵安军：形式分析、概念构建。权伟：调查、数据整理。薛晓：监督、数据整理。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号