
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的新型堆叠集成变体在短期风速预测中的应用与性能优化
【字体: 大 中 小 】 时间:2025年07月28日 来源:Neurocomputing 5.5
编辑推荐:
为解决风电并网中风速预测精度不足的问题,研究人员提出新型Data Stacking集成算法,结合10种基学习器(DT/SVR/MLP等)和气象数据特征工程。实验表明该模型在巴西实测数据中MAE低至0.4855,误差较传统Stacking降低0.7%-4.4%,为可再生能源预测提供创新解决方案。
随着全球能源结构转型加速,风电装机容量在2022年已达906GW,但风速的间歇性特性导致电网调度面临巨大挑战。巴西作为风电新兴市场,其25.6GW装机容量背后隐藏着因预测不准引发的电压波动、供需失衡等问题。传统数值天气预报(NWP)和单一机器学习模型在短期风速预测中往往捉襟见肘,特别是面对热带气候多变的气象特征时。
针对这一难题,巴西联邦大学(Universidade Federal do Pará)的SEBASTI?O B. FONSECA团队在《Neurocomputing》发表研究,创新性提出Data Stacking集成算法。该方法突破传统Stacking仅融合基学习器预测结果的局限,将原始气象数据与10种基学习器(包括DT、LSTM、Transformer等)的预测结果共同输入元模型,在巴西马塞约市2013-2017年气象数据测试中实现nRMSE 0.2389的突破性表现。
关键技术包括:1)多源气象数据预处理与特征选择;2)构建包含CNN、GRU等10种异构基学习器的模型池;3)创新性数据堆叠架构设计;4)采用KSOPI基准数据集进行交叉验证。
【Ensemble Models using Machine Learning Algorithms】
研究对比了Data Stacking与传统Stacking、Multi-level Stacking的结构差异,通过基学习器多样性指数证明新方法能有效整合ET、XGBT等算法的互补优势。
【Proposed Methodology】
采用滑动窗口技术构建时空特征,通过皮尔逊相关系数筛选温度、湿度等关键变量,结合递归特征消除(RFE)优化输入维度。
【Data Description】
基于巴西INMET气象站数据,针对9°S热带沿海地区特有的干湿季气候,构建包含风速、大气压等15维特征的时序数据库,采样间隔为10分钟。
【Results and Discussions】
在1小时预测场景下,Data Stacking的MAE较最优基学习器(LSTM)降低23.7%。特别值得注意的是,即使基学习器单独预测性能较差时,新方法仍能保持稳定表现,验证了架构的容错性。
【Conclusions】
该研究不仅为热带地区风电预测提供新工具,更开创性地证明:融合原始数据与中间预测结果能显著提升集成模型鲁棒性。这种架构对光伏功率预测等时序问题具有普适参考价值,其误差降低4.4%的边际效益对GW级风电场运营具有重大经济意义。研究同时揭示,当基学习器包含TRANSF等注意力机制模型时,数据堆叠的协同效应最为显著。
生物通微信公众号
知名企业招聘