基于深度学习和NSGA-III优化的水电站水位预测方法研究
《Renewable Energy》:Water level forecasting for hydroelectric power plants using deep learning
【字体:
大
中
小
】
时间:2025年11月04日
来源:Renewable Energy 9.1
编辑推荐:
本研究针对水电站水位预测中非线性动态捕捉困难及模型调参耗时的问题,提出了一种结合时间序列密集编码器(TiDE)和非支配排序遗传算法III(NSGA-III)的端到端自动预测工作流。该方法在三个不同规模的真实水库数据集上验证,相比基线TiDE实现,预测精度提升最高达44.16%,并将超参数调优时间从数周缩短至约17小时。研究成果为水电站可靠发电、水库管理和防洪减灾提供了高效精准的解决方案,对可再生能源领域的智能化管理具有重要意义。
随着全球对可再生能源依赖的加剧,水电站的可靠运行变得至关重要。水位预测直接影响发电调度、水库进出水管理以及防洪策略,然而,水文系统受气候变量、流域特性和人为干预等多重因素影响,呈现出高度非线性和复杂性,传统预测方法难以准确捕捉其动态变化。尽管机器学习和深度学习模型在该领域展现出潜力,但其性能往往受限于繁琐的特征工程和耗时的超参数调优,且现有研究多集中于发电量、温度或涡轮机状态预测,专门针对水库水位预测的方法仍属新颖且具有重要实践意义。
为解决上述挑战,来自罗马尼亚锡比乌卢奇安·布拉加大学计算机科学与电气工程系的Darius Peteleaza、Alexandru Matei、Radu Sorostinean、Arpad Gellert、Bala-Constantin Zamfirescu以及Ugo Fiore、Francesco Palmieri等研究人员在《Renewable Energy》上发表论文,提出了一种新颖的端到端全自动预测工作流。该方法将时间序列密集编码器(Time-series Dense Encoder, TiDE)与非支配排序遗传算法III(Non-dominated Sorting Genetic Algorithm III, NSGA-III)相结合,旨在实现高精度的水电站水位预测,同时大幅降低模型调优成本。
为开展研究,作者团队主要运用了几项关键技术方法:首先,利用来自哥伦比亚电网的三个真实世界水电站(Sogamoso大坝、Guavio大坝和San Carlos水电站)的日水位测量数据作为样本队列,涵盖了大型、中型和小型水库的不同规模;其次,采用时间序列密集编码器(TiDE)这一专为长期时间序列预测设计的神经网络架构,该模型仅使用多层感知机(MLP),在数据历史和预测范围方面具有线性可扩展性;再者,引入非支配排序遗传算法III(NSGA-III)进行超参数优化,即使对于最小化均方误差(MSE)这一单目标优化问题也表现出色,并能有效处理离散和条件性超参数选择;此外,还应用了功能方差分析(functional ANOVA, fANOVA)来量化各超参数对模型性能的影响重要性;最后,通过包括平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)、对称平均绝对百分比误差(SMAPE)在内的多种指标对模型性能进行全面评估。
研究人员将优化后的TiDE模型与多种先进的机器学习和深度学习时间序列预测方法进行了比较,包括DLinear、N-HiTS、PatchTST以及AdaBoost、支持向量机(SVM)、随机森林和XGBoost等。在所有三个数据集(Sogamoso、San Carlos、Guavio)上的实验结果表明,优化后的TiDE模型在绝大多数关键误差指标(如MAE、MSE、RMSE)上均优于其他对比模型,展现了其在不同规模和区域条件下水位预测的鲁棒性和准确性。例如,在Sogamoso数据集上,TiDE的MAE为0.546,MSE为0.415,均显著低于其他模型。
通过功能方差分析(fANOVA)评估了各超参数对模型性能的影响。结果显示,历史输入长度(hist_len)、丢弃率(dropout_rate)和学习率(learning_rate)是影响预测精度的最关键超参数,但其重要性在不同数据集间存在差异,强调了针对特定数据集进行超参数优化的必要性。研究还给出了针对每个数据集优化后的超参数具体取值,例如,对于Sogamoso数据集,最优历史长度为96,学习率为10-2,丢弃率为0.3。
通过可视化预测结果与真实水位的对比图,定性展示了优化后TiDE模型的优越性。与DLinear、PatchTST和N-HiTS等模型相比,TiDE的预测曲线与真实值贴合度最高,能够更准确地捕捉水位的波动趋势和峰值,证明了其在模拟复杂水文时间序列动态方面的强大能力。训练和验证损失曲线也表明模型优化过程稳定,未出现过拟合或欠拟合。
将使用默认超参数的原始TiDE模型与经过NSGA-III优化的TiDE模型进行对比,优化后的模型在所有数据集和评估指标上均取得了显著提升。性能改善幅度最高达44.16%(San Carlos数据集的MAPE),充分证明了所提出的超参数优化工作流的有效性。消融研究也表明,搜索空间剪枝策略能够帮助优化算法在更少的试验次数内找到接近最优的配置,提升了搜索效率。
比较了不同超参数搜索策略所需的时间资源。与穷举搜索(估计需4322天)、随机搜索(估计需41天)和手动搜索(估计需7天)相比,NSGA-III搜索策略将总优化时间大幅缩短至约17小时,凸显了其在处理大规模超参数空间时的高效性。
该研究成功地将TiDE模型与NSGA-III优化算法相结合,为水电站水位预测提供了一个高效、精准且自动化的解决方案。通过引入领域知识指导的超参数空间剪枝策略,显著降低了超参数调优的计算成本和时间消耗。在三个真实水库数据集上的广泛实验验证了该方法的优越性,其预测精度显著超过多种先进基线模型,并对原始TiDE实现有大幅改进。功能方差分析提供了对超参数重要性的深入理解,为实践者提供了可操作的见解。研究成果表明,该工作流能够无缝适应不同的预测任务和数据集,无需人工干预,突出了其在提高水位预测准确性方面的有效性、实用性和泛化能力,对于提升水电站运行效率、促进可再生能源整合以及增强水资源管理韧性具有重要的理论和实践意义。未来的工作可以探索将该框架应用于其他可再生能源预测场景,并进一步集成到自主决策支持系统中。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号