HEC-HMS模型和人工神经网络模型在模拟突尼斯Medjerda河上游流域径流方面的准确性

《Journal of Hydrology: Regional Studies》:Accuracy of HEC-HMS and Artificial Neural Network models in simulating runoffs in upper valley of the Medjerda-Tunisia

【字体: 时间:2025年08月07日 来源:Journal of Hydrology: Regional Studies 4.7

编辑推荐:

  参考蒸散量预测在干旱区农业水管理中的关键作用,本研究采用六种混合深度学习模型(LSTM、BiLSTM、CNN-LSTM、CNN-BiLSTM、CNN-LSTM-Attention、CNN-BiLSTM-Attention)对塔克拉玛干沙漠绿洲地区进行1-5天提前的ET?预测,通过SHAP分析揭示特征贡献,并利用GPI综合评估模型性能。结果表明,CNN-BiLSTM-Attention模型在所有预测周期中均表现最优,其1天提前预测的NSE达0.861,GPI指数提升显著;BiLSTM模型较LSTM提升约56%的GPI值,而CNN模块通过提取时空特征增强模型泛化能力。SHAP分析显示温度(Tmax)和太阳辐射(RS)是主要驱动因素,不同站点呈现空间异质性特征。研究为干旱区精准灌溉提供了可解释的预测框架和科学依据。

  该研究聚焦于中国新疆南部塔克拉玛干沙漠绿洲区域,这是全球最具水文挑战性和气候极端性的农业地区之一。通过采用六种先进的混合深度学习模型,包括长短期记忆网络(LSTM)、双向LSTM(BiLSTM)、卷积神经网络- LSTM(CNN-LSTM)、卷积神经网络- BiLSTM(CNN-BiLSTM)、卷积神经网络-LSTM-注意力机制(CNN-LSTM-Attention)以及卷积神经网络-BiLSTM-注意力机制(CNN-BiLSTM-Attention),研究人员试图提升每日参考蒸散发(ET0)的短期预测精度。为了实现这一目标,研究团队收集了25个站点的历史每日气象数据,并将1991年至2020年的数据用于模型训练,而2021年至2023年的数据则被保留用于独立测试。模型预测了1天、3天和5天的预测时间。为了评估模型性能,研究采用全球性能指数(GPI),同时通过Shapley Additive Explanations(SHAP)分析,进一步提升了模型的可解释性,揭示了不同气候条件下特征变量对ET0的贡献。

### 研究背景与意义

农业是水资源消耗的主要领域,中国农业用水占全国总用水量的约60%。随着人口增长和气候变化加剧,农业用水需求正面临更大的压力。因此,实现高质量农业生产和可持续发展成为一项关键挑战。优化干旱地区的农业运营需要提高灌溉用水效率。参考蒸散发(ET0)在水文循环中起着至关重要的作用,是确定农业灌溉需求的重要指标。ET0量化了作物蒸腾作用和土壤蒸发过程中的水分损失,对农业灌溉规划具有重要意义。在沙漠地区,土壤和水资源保护及防风固沙措施进一步凸显了减少水分损失的必要性。蒸散发显著影响植被布局,合理的植被规划不仅能减少水分损失,还能有效提升植被覆盖率。

在干旱地区,准确预测ET0对于提高农业生产力和实现可持续发展至关重要。塔克拉玛干沙漠绿洲区域以其稀少的降雨、强烈的蒸发和极其有限的灌溉水资源,成为需要准确ET0预测以优化水资源管理和灌溉调度的典型区域。传统的ET0计算方法主要依赖于从气象变量中推导出的经验公式,如FAO-56 Penman-Monteith公式,以及其他如Hargreaves–Samani、Priestley-Taylor和Valiantzas公式。然而,随着气候情景变得更加动态,以及农业管理更加精确,传统经验方法在性能上的局限性愈发明显。为此,研究人员引入了机器学习算法,包括随机森林、梯度提升、K近邻(KNN)和支持向量回归(SVR),这些方法在静态ET0估计中表现出更高的准确性。此外,先进的软计算方法,特别是人工神经网络(ANN)和优化的KNN变体,已被证明能够通过合适的架构调整,在不同气候条件下实现高精度的每日ET0预测。

然而,大多数经典机器学习模型主要针对ET0估计,而非真正的时序预测,这限制了它们在实际农业水资源管理中的直接应用。虽然滑动窗口等方法可以调整这些模型以适应序列预测,但它们往往无法完全捕捉到关键的时序依赖性。最近的研究显示,基于递归神经网络(RNN)的集成方法,尤其是LSTM,在不同气候区域的多日预测中表现出强大的稳健性和准确性,其性能通常受到当前气候和预测变量选择的影响。

### 模型构建与数据处理

研究团队利用了33年的每日气象数据,涵盖了从1991年至2023年的记录。为了确保训练数据和测试数据的一致性,并提高模型训练效率,所有输入和目标变量均采用最小-最大归一化技术进行预处理。在生成预测后,输出会被逆变换回原始尺度以准确评估性能。归一化和逆归一化过程如下:

$$ x_{scaled} = \frac{x - x_{min}}{x_{max} - x_{min}} $$

$$ x = x_{scaled} \cdot (x_{max} - x_{min}) + x_{min} $$

其中,$ x_{scaled} $ 表示归一化后的变量,$ x $ 表示原始变量(输入或目标),$ x_{min} $ 和 $ x_{max} $ 分别代表训练集中相应变量的最小值和最大值。

在构建模型时,研究团队采用六种不同的混合深度学习模型,包括LSTM、BiLSTM、CNN-LSTM、CNN-BiLSTM、CNN-LSTM-Attention和CNN-BiLSTM-Attention。这些模型的性能通过全球性能指数(GPI)进行评估,而SHAP分析则用于解释不同气候条件下特征变量的贡献。

### 模型表现与性能分析

研究结果显示,基于BiLSTM的模型在ET0预测精度方面优于基于LSTM的模型。此外,引入卷积神经网络(CNN)和注意力机制进一步提升了预测性能。其中,CNN-BiLSTM-Attention模型在不同站点和预测时间范围内表现出最高的准确性和稳健性,使其成为沙漠绿洲地区操作部署的最适宜模型。

SHAP分析表明,温度和太阳辐射是大多数站点中ET0的主要驱动因素,突显了特征重要性在空间上的异质性。因此,本研究不仅提供了稳健且可解释的ET0预测模型,还为区域化的水资源管理提供了新的水文见解,同时增强了在极端干旱农业系统中部署精确灌溉模型的信心。

在模型训练和预测结果中,研究人员发现所有模型在1天的预测中表现最佳,而随着预测时间的增加,准确度有所下降。例如,LSTM模型的1天预测平均NSE为0.798,KGE为0.801,IOA为0.939,R2为0.843,MSE为1.051 mm/d,RMSE为1.001 mm/d,MAE为0.731 mm/d,MAPE为28.095%。而BiLSTM模型在1天的预测中表现出更高的准确度,其NSE为0.817,KGE为0.838,IOA为0.947,R2为0.840,MSE为0.946 mm/d,RMSE为0.954 mm/d,MAE为0.696 mm/d,MAPE为28.480%。相比之下,CNN-LSTM模型在1天的预测中表现最佳,其NSE为0.826,KGE为0.848,IOA为0.951,R2为0.851,MSE为0.868 mm/d,RMSE为0.921 mm/d,MAE为0.675 mm/d,MAPE为27.627%。

在3天和5天的预测中,CNN-BiLSTM-Attention模型在多个指标上表现出色,其NSE分别为0.784和0.763,KGE分别为0.841和0.828,IOA分别为0.938和0.931,R2分别为0.802和0.777,MSE分别为1.112 mm/d和1.229 mm/d,RMSE分别为1.039 mm/d和1.092 mm/d,MAE分别为0.741 mm/d和0.794 mm/d,MAPE分别为27.158%和29.721%。这些结果表明,随着预测时间的增加,模型的预测准确度呈下降趋势。

此外,研究团队还分析了不同站点的模型表现。在1天的预测中,表现最佳的站点包括Aksu(GPI值为0.226)、Yarkant(0.155)、Xayar(0.139)、Pishan(0.121)和Baicheng(0.091)。而在3天和5天的预测中,这些站点的GPI值分别为0.183和0.170。值得注意的是,对于5天的预测,表现最差的站点包括Atush(GPI值为-0.202)、Kashgar(-0.209)和Wuqia(-0.747)。这表明,模型在某些站点的预测表现受到气候条件和特征变量的影响,尤其是在西北边缘的站点,由于独特的微气候效应,预测难度较大。

### 模型训练时间与性能比较

研究还比较了不同模型的训练时间。结果表明,随着模型复杂度的增加,训练时间呈阶梯式增长。最简单的模型训练时间最短,而引入更复杂结构(如深度网络层和高级模块)的模型训练时间显著增加。特别地,引入卷积层的模型训练时间远高于仅使用循环层的LSTM和BiLSTM模型,而注意力机制的加入进一步放大了这一效应。CNN-BiLSTM-Attention模型由于其复杂的架构,表现出最高的平均训练时间,表明模型复杂度与计算成本之间存在显著的正相关关系。

在预测结果的比较中,所有BiLSTM基于的混合模型在ET0预测中的平均GPI值均高于LSTM基于的模型。例如,在1天的预测中,BiLSTM模型的平均GPI值为0.226,而LSTM模型的平均GPI值为0.155。这一趋势在3天和5天的预测中也得到了验证,表明BiLSTM在时间序列预测任务中具有更强的建模能力。然而,尽管CNN-BiLSTM-Attention模型在3天和5天的预测中表现优于CNN-LSTM-Attention模型,但两者之间的差异并不具有统计学意义。

### SHAP分析与特征重要性

SHAP分析揭示了不同站点中气象变量对ET0预测的贡献程度。结果显示,温度和太阳辐射是大多数站点中ET0的主要驱动因素,而其他变量如相对湿度、大气压和降水则影响较小。这种特征重要性的空间异质性为区域化水资源管理提供了重要的参考依据。例如,在Aheqi、Baicheng、Baluntai、Kashgar、Korla、Kuqa、Luntai、Tieganlike、Wuqia、Yarkant和Yuli站点中,Tmax和RS的平均绝对SHAP值显著高于其他变量。而在Aksu、Alar、Atush、Bachu、Hotan、Keping、Makit、Qiemo、Ruoqiang、Xayar和Yutian站点中,大气压与温度和太阳辐射并列成为重要影响因素。相比之下,降水和风速的SHAP重要性普遍较低,表明这些因素对短期ET0预测的贡献较小。

这些发现不仅揭示了ET0预测中关键气象变量的贡献,还为制定本地化的水资源管理策略提供了依据。SHAP分析增强了模型的透明度和可解释性,使研究人员能够理解模型如何整合不同气象因素,从而更科学地评估ET0的变异性。这为智能灌溉和水资源管理提供了坚实的基础。

### 模型局限性与未来研究方向

尽管本研究在塔克拉玛干沙漠绿洲区域取得了显著成果,但仍有局限性。例如,所有模型在复杂季节或微气候条件下均存在低估ET0的倾向,这可能与数据质量和空间覆盖范围有关。此外,由于缺乏直接的用户反馈,模型在实际应用中的评估仍存在一定的限制。未来的研究可以探索物理信息神经网络、多模态遥感数据和土地利用动态的结合,以增强模型的实用性。

此外,虽然本研究的模型在塔克拉玛干沙漠绿洲区域表现出良好的泛化能力,但其在其他干旱绿洲农业区域的应用性仍需系统验证。为了提升模型的可扩展性和操作性,未来可以考虑采用迁移学习、模型微调和多源数据融合等技术。这些方法有助于提高模型在新预测环境中的适应能力。

### 结论

本研究全面探讨了在极端干旱的塔克拉玛干沙漠绿洲区域,使用六种先进的混合深度学习模型进行每日参考蒸散发(ET0)的多步预测。主要结论包括:

1. 所有深度学习模型,尤其是具有双向和混合架构的模型,在25个气象站点中表现出显著的预测能力,但预测精度存在空间差异。预测精度在中央和东部绿洲站点较高,而在西北边缘站点则较低。
2. 建立了清晰的模型性能等级:CNN-BiLSTM-Attention > CNN-LSTM-Attention > CNN-BiLSTM > CNN-LSTM > BiLSTM > LSTM。这一等级突显了融合CNN特征提取、双向时序建模和注意力机制的协同优势。CNN-BiLSTM-Attention网络在所有预测时间范围内表现出最高且最稳定的性能。
3. 最优的CNN-BiLSTM-Attention模型在1天的预测中表现出优越的预测指标,如NSE(0.801–0.906)、KGE(0.736–0.947)、IOA(0.943–0.976)、R2(0.814–0.915)、MSE(0.325–1.416 mm/d)、RMSE(0.570–1.190 mm/d)、MAE(0.372–0.785 mm/d)和MAPE(14.981%–25.982%)。
4. SHAP分析揭示了温度和太阳辐射是大多数地点ET0的主要驱动因素,同时也暴露了特征影响的空间异质性。这种可解释性为制定基于数据的本地化水资源管理策略提供了支持,并加深了对绿洲农业生态系统中ET0空间变异性及其气象驱动因素的理解。
5. 尽管取得了进展,但所有模型在复杂季节或微气候条件下均存在低估ET0的趋势,表明需要进一步的方法创新,如引入Transformer架构或增加其他环境预测因子,以减少预测不确定性。

综上所述,本研究为极端干旱、数据稀缺的农业地区提供了新的预测框架和可操作的水文见解。CNN-BiLSTM-Attention模型与基于SHAP的特征归因相结合,为在全球气候压力下实施智能、适应性的灌溉和水资源管理提供了坚实的基础,同时也为在类似极端干旱环境中的下一代操作部署和研究指明了方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号