
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度学习与机器学习模型在克里希纳河流域一日前径流预测中的比较分析
【字体: 大 中 小 】 时间:2025年06月24日 来源:Journal of Hydrology: Regional Studies 4.7
编辑推荐:
为解决克里希纳河流域短期径流预测精度不足的问题,研究人员开展了一项比较11种ML/DL模型(包括LSTM、GRU、RF、XGBoost等)的综合性研究。结果表明,Bi-LSTM在3个流域表现最优(NSE达0.864),GRU在Sarati流域领先(NSE≈0.7),但所有模型对极端流量预测均存在局限。该研究为流域特异性模型选择提供了科学依据,对洪水预警和水资源管理具有重要意义。
在全球气候变化加剧的背景下,极端水文事件频发使得精准的径流预测成为水资源管理和防灾减灾的关键。克里希纳河作为印度半岛第二大流域,支撑着7200万人口的生计,但其水文系统正面临过度开发和气候变化的双重压力。传统物理水文模型虽能模拟水文循环过程,但存在数据需求量大、校准复杂等缺陷;而数据驱动模型如机器学习(ML)和深度学习(DL)虽能直接从历史数据中学习规律,但模型选择缺乏区域适应性研究,且对极端流量预测能力不足。
针对这一科学问题,国内研究人员在《Journal of Hydrology: Regional Studies》发表了一项开创性研究,系统比较了5种ML模型(KNN、SVR、RF、AdaBoost、XGBoost)和6种DL模型(LSTM、Bi-LSTM、GRU、Bi-GRU、CNN、WaveNet)在克里希纳河流域4个子流域(Karad、Keesara、Sarati、T.Ramapuram)的日尺度径流预测性能。研究采用印度气象部门0.25°网格降水数据和中央水资源委员会径流观测数据,通过交叉相关分析和PACF确定滞后输入变量,使用网格搜索优化超参数,并采用NSE、RMSE、ATPE-2%等8项指标评估模型表现。
关键技术方法
研究采用3步保留法划分数据集(80%训练、20%测试),通过ADF检验验证数据平稳性,利用Thiessen多边形法计算流域平均气象数据。ML模型采用Scikit-learn和XGBoost库开发,DL模型基于TensorFlow框架构建,使用365天滑动窗口和Adam优化器。模型评估结合统计指标与泰勒图、小提琴图等可视化工具,并特别针对98%分位数以上的极端流量进行性能分析。
研究结果
3.2.1 Karad流域
Bi-LSTM在测试集表现最优(NSE=0.864),较基础LSTM提升显著。RF在训练集表现最佳(NSE=0.898),但测试集略逊于Bi-LSTM。所有模型对>98%分位数的极端流量预测误差显著,最大误差达3999.306 m3/s(XGBoost)。
3.2.2 Keesara流域
Bi-LSTM仍保持优势(测试集NSE=0.708),但未达"优秀"标准(NSE>0.75)。SVR在训练集对极端流量捕捉最佳(ATPE-2%=27.226),但测试集最大误差高达4039.842 m3/s。
3.2.3 Sarati流域
GRU成为最佳模型(NSE≈0.7),Bi-LSTM与RF紧随其后(NSE=0.686)。AdaBoost表现最差(NSE=0.173),反映其对噪声敏感的特性。
3.2.4 T.Ramapuram流域
Bi-LSTM再次领先(NSE=0.702),但所有模型NSE均未超过0.75。CNN在训练集表现良好(ATPE-2%=37.78),但测试集泛化能力不足。
3.3 结果分析
研究发现:1)双向结构对LSTM提升显著(如Karad流域Bi-LSTM较LSTM的NSE提高0.05),但对GRU效果相反;2)RF和XGBoost表现与DL模型相当,证明在短期预测中近期信息比长期记忆更重要;3)KNN因均值计算原理必然低估训练集未见的极端流量;4)SVR在低-中流量预测优异但高流量表现差;5)AdaBoost因过度关注极端值导致整体性能波动。
3.4 与持续性模型对比
在98%分位数以上极端事件中:Karad流域因PACF高达0.9,模型预测多接近持续性模型;其他流域(PACF=0.68-0.71)模型表现更独立。Bi-LSTM在75%(Karad)至85.71%(T.Ramapuram)的极端事件中优于持续性模型,但无模型能完全准确预测峰值流量。
研究结论与意义
该研究首次在克里希纳河流域系统评估多种ML/DL模型的径流预测性能,证实:1)Bi-LSTM在多数流域表现最优,但GRU在特定流域(如Sarati)可能更优;2)RF和XGBoost作为ML代表,其性能与DL模型相当且计算效率更高;3)所有模型对极端流量预测存在系统性偏差,反映数据驱动方法在样本外推时的固有局限。
这项研究为流域尺度的模型选择提供了实证依据,建议在实际应用中:1)优先测试Bi-LSTM和GRU;2)对计算资源有限场景可考虑RF/XGBoost;3)需结合物理模型改进极端流量预测。成果对发展印度半岛智能水文预警系统、优化水库调度具有重要实践价值,同时为全球类似流域的短期径流预测方法选择提供了参考范式。未来研究可探索融合遥感土壤湿度数据或开发区域统一模型以进一步提升预测精度。
生物通微信公众号
知名企业招聘