一种基于小波Kolmogorov–Arnold网络和平行双向门控循环单元的多尺度特征提取与融合框架,用于电力负荷预测
《Engineering Applications of Artificial Intelligence》:A multi-scale feature extraction and fusion framework based on wavelet Kolmogorov–Arnold networks and parallel Bi-directional gated recurrent units for electric load forecasting
【字体:
大
中
小
】
时间:2025年09月27日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
电力负荷多尺度预测模型NP-WavKAN-Fusion通过融合Neural Prophet分解与WavKAN小波核编码,结合BiGRU时序建模和自适应特征融合门,在澳大利亚和摩洛哥数据集上实现误差降低30%,并通过Diebold-Mariano检验验证显著性。
随着全球能源结构的快速转型,传统依赖化石燃料的电力系统正逐步向以可再生能源为核心的智能电网演进。国际能源署(IEA)发布的《世界能源展望》报告指出,可再生能源的装机容量在全球范围内持续增长,推动了电力系统的去碳化进程。与此同时,可再生能源的输出具有间歇性和随机性,与日益多样化的电力需求相结合,使得负荷序列呈现出显著的非线性、多尺度周期性和非平稳性特征。这种复杂的特性不仅影响了电网的运行稳定性,也对电力负荷预测提出了更高的要求。
在这样的背景下,负荷预测技术已成为确保电网安全、优化市场调度以及促进可再生能源整合的关键手段。然而,现有预测方法在同时捕捉长期趋势和短期波动方面仍面临挑战,尤其是在面对突发变化时,其敏感性和泛化能力不足,这限制了其在提升时间-频率建模和适应复杂环境方面的潜力。因此,需要一种能够有效应对这些挑战的新方法。
当前的电力负荷预测方法主要分为统计方法、机器学习(ML)技术和混合模型。早期的统计模型,如线性回归、ARMA、ARIMA、指数平滑和灰色模型(GM),在捕捉季节性特征方面具有较低的复杂度和较高的可解释性。然而,这些方法通常依赖于平稳性假设,无法应对现代电力系统中普遍存在的非平稳性、强非线性和多源干扰问题。随着可再生能源渗透率的提高和负荷复杂性的增加,这些局限性促使了人工智能(AI)方法的应用。
机器学习技术已经成为负荷预测研究的重要方向。与统计模型不同,机器学习方法采用数据驱动的方式,从历史数据和外部特征中捕捉非线性映射和时间模式。代表性方法包括支持向量回归(SVR)用于小规模预测,以及随机森林(RF)、梯度提升决策树(GBDT)、极端梯度提升(XGBoost)和LightGBM等集成方法,这些方法在处理多特征输入和非线性回归方面表现出色。然而,大多数机器学习方法仍然依赖于人工提取的时间特征,往往难以捕捉跨尺度的依赖关系,导致在非平稳和干扰较大的条件下预测精度下降。
相比之下,深度学习(DL)方法由于其端到端建模能力,被广泛应用于负荷预测任务。循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环单元(GRU),能够有效捕捉时间依赖性。LSTM在建模长期依赖方面具有优势,而GRU则以更少的参数实现相近或更优的性能。双向GRU(BiGRU)进一步增强了对非平稳序列的适应能力,通过同时建模前向和后向依赖关系。卷积神经网络(CNN)在提取局部模式和识别短期扰动方面具有优势,而混合架构(如CNN-LSTM、CNN-BiGRU)则结合了局部和长期建模能力,提升了多尺度预测的性能。时间卷积网络(TCN)也提供了高效的并行计算能力和更强的长期依赖建模能力,但其在超长序列和跨尺度预测方面仍存在一定的局限。
为了解决这些问题,基于Transformer的模型逐渐成为长序列预测的核心。Informer通过稀疏注意力机制降低了计算复杂度,Autoformer引入了分解-重构机制以增强趋势和季节性建模能力,而FEDformer则结合了傅里叶和小波分解以实现频域学习。近年来,PatchTST通过分块表示和分层解耦机制提升了多步预测的性能,iTransformer则在多任务学习框架中利用可逆结构以增强对光伏、风力和负荷预测的鲁棒性。尽管这些模型在提升预测性能方面取得了进展,但它们在高可再生能源电力系统中仍面临计算负担重和过拟合风险高的问题。
在这样的背景下,混合预测模型逐渐成为负荷预测研究的热点,主要分为分解-预测模型和结构融合模型。分解-预测模型通过信号分解技术将复杂的负荷序列拆分为相对平稳的子组件,然后分别进行预测。常见的分解方法包括经验模态分解(EMD)、变分模态分解(VMD)和改进的完全自适应经验模态分解(CEEMDAN)。例如,Fan等人(2024)将小波分解与CNN、RNN、LSTM和优化算法结合,实现了自适应多尺度特征建模;Wen等人(2024)则将OVMD和CEEMDAN与LSTM框架结合,以提升短期预测精度。此外,季节-趋势分解(STL)和NeuralProphet(NP)也通过分解负荷序列为趋势和季节性组件,展现了良好的预测性能。尽管这些方法在提升预测精度方面有效,但它们通常依赖于“分解-预测”的顺序流程,分解误差可能在重构过程中被放大,同时缺乏组件间的显式交互建模,适应多分辨率动态的能力有限,且可能面临信息泄露的问题。
相比之下,结构融合模型强调在统一框架中进行端到端的联合建模。Zhang等人(2025b)提出了一个TCN-Informer-BiGRU模型,联合学习多层时空特征;Li等人(2025b)设计了一个CGAN-BiTCN-BiGRU模型,结合了条件生成对抗网络(CGAN)、双向时间卷积网络(BiTCN)、BiGRU和注意力机制,以应对数据稀缺和异构条件;Abbas等人(2025)开发了一个基于堆叠的框架,集成LightGBM、MLP和Kolmogorov–Arnold网络(KAN),并进一步引入元学习策略以提升模型的鲁棒性;Fan等人(2025b)将改进的Salp Swarm算法(ISSA)融入BiTCN-LSTM模型中,利用全局超参数优化以增强预测精度。尽管这些方法能够在局部特征提取和全局依赖建模之间取得平衡,但它们往往存在结构不一致、可解释性有限和计算成本高的问题。
总体来看,尽管在负荷预测领域取得了显著进展,现有的混合建模方法仍面临准确性、可解释性和复杂性之间的根本权衡。因此,迫切需要一种统一且轻量级的建模范式,能够无缝整合多尺度分解、非线性特征提取和动态记忆机制。为了验证现有模型的性能,本文进行了全面的对比分析,并在表1中提供了相关结果。
近年来,Kolmogorov–Arnold网络(KAN)因其用可学习的样条基函数替代传统激活函数而受到越来越多的关注,从而在逼近能力和可解释性方面得到提升。与传统的多层感知机(MLP)相比,KAN表现出更强的表示能力,并减少了训练冗余,已在短期负荷预测、水文流量建模和太阳能辐射预测等领域得到成功应用。然而,其使用固定尺度的样条函数限制了其在具有多个共存频率的非平稳信号上的性能,使得难以同时捕捉分钟级扰动和日级趋势。
为了解决这一局限,小波分析最近被引入到KAN中,形成了Wavelet-KAN(WavKAN)模型。通过用可学习的小波核函数参数化边缘激活,WavKAN自然继承了时频局部化能力。由于电力负荷序列具有显著的时频特性,包括时域中的多尺度周期性和由天气、用户行为和电动汽车渗透率引起的频域中的高频波动,WavKAN特别适合于建模这些动态变化。尽管WavKAN在图像和信号处理任务中表现出色,但在负荷预测方面的有效性和适应性仍需系统性评估。
基于上述分析,本文探讨了WavKAN在电力负荷预测任务中的适用性,并提出了一个并行混合框架NP-WavKAN-Fusion,该框架整合了改进的Kolmogorov–Arnold网络与BiGRU。该框架结合了WavKAN在捕捉非线性静态特征方面的能力,以及BiGRU在建模时间动态方面的优势,从而实现了跨多个时间尺度的准确预测。具体而言,首先应用NeuralProphet(NP)分解,从原始负荷序列中提取趋势、季节性、自回归和残差组件,为模型提供结构化的特征支持。随后,WavKAN模块利用可学习的小波核函数对非线性静态特征进行建模,而BiGRU模块则同时建模序列依赖关系。最后,引入一个自适应特征融合(AFF)机制,动态整合静态和动态特征流,克服了传统固定权重融合的局限,提升了模型的预测鲁棒性。
为了验证所提出模型的有效性,本文在澳大利亚和摩洛哥的两个公开电力负荷数据集上进行了短期单步(30分钟/10分钟)和多步(12小时/24小时)预测实验。同时,进行了全面的消融研究、统计显著性测试(Diebold–Mariano)以及与现有先进方法(如Transformer和PatchTST)的系统性对比。实验结果表明,NP-WavKAN-Fusion在不同时间分辨率和负荷场景下均优于竞争模型,实现了更高的预测精度、稳定性和鲁棒性。这突显了NP-WavKAN-Fusion作为结构统一、特征丰富且计算高效的解决方案,适用于高性能电力负荷预测任务。
本文提出了一种基于可学习小波核函数的混合时间序列预测框架,专门设计用于提升短期电力负荷预测性能。本研究的主要贡献总结如下:
首先,提出了一种新颖的网络架构。该框架用具有可学习尺度和位移参数的小波核函数替代传统KAN中的激活函数,从而显著提升了模型捕捉负荷数据中尖峰、突变和周期性特征的能力。采用并行结构,其中WavKAN和BiGRU分别提取静态和动态表示,同时引入自适应特征融合(AFF)机制,动态整合两种特征流,增强了模型对复杂负荷演变模式的表征能力。
其次,提升了多尺度建模能力。虽然传统的KAN或基于样条的激活函数在处理非平稳时间序列方面存在局限,但WavKAN通过引入小波核函数,显著增强了对局部变化和多尺度动态的表征能力,弥补了传统模型在建模高频扰动方面的不足。
第三,通过NP实现显式的序列分解。基于NP的预处理策略将原始负荷序列分解为趋势、季节性和残差组件,有效降低了输入的波动性和不确定性。这种设计在原始特征稀疏的场景中具有显著优势,显著提升了模型的稳定性和泛化能力。
第四,实现了卓越的短期预测性能。在12小时和24小时的多步预测任务中,NP-WavKAN-Fusion将误差增长控制在15%以内,持续优于长序列模型如Informer和Autoformer。这些结果表明,该模型具有良好的跨尺度泛化能力,适用于滚动调度和高分辨率短期负荷响应场景。
本文的其余部分组织如下:第二部分介绍了所提出模型的整体架构和模块设计;第三部分描述了实验设置,包括数据预处理、特征选择方法和评估指标;第四部分讨论并分析了实验结果,涵盖了与现有先进模型的对比、模型组件的消融研究、不同预测范围下的性能评估以及通过Diebold–Mariano方法进行的统计显着性测试;第五部分总结了研究的关键发现,并探讨了未来研究和应用的潜在方向。
综上所述,本文提出的NP-WavKAN-Fusion框架通过整合多尺度分解、非线性特征提取和动态记忆机制,为电力负荷预测提供了一种结构统一、特征丰富且计算高效的解决方案。该模型不仅在预测精度和稳定性方面表现出色,还通过自适应特征融合机制提升了预测的鲁棒性,能够有效应对电力系统中复杂多变的负荷特征。实验结果进一步验证了该框架在实际应用中的潜力,为未来的电力负荷预测研究提供了新的思路和方法。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号