基于LSTM及其变体的标准化降水指数预测

《Physics and Chemistry of the Earth, Parts A/B/C》:Prediction of Standardized Precipitation Index based on LSTM and Variants of LSTM

【字体: 时间:2026年03月28日 来源:Physics and Chemistry of the Earth, Parts A/B/C 3.0

编辑推荐:

  干旱预测对农业规划和水资源管理至关重要。本研究采用LSTM、S-LSTM、BiLSTM和S-BiLSTM四种深度学习模型,基于120年降雨数据预测印度Coimbatore站的SPI干旱指数,发现S-BiLSTM在长期预测(SPI-12至SPI-24)中表现最优(R2>0.94),而短期预测(SPI-1)受数据噪声影响显著,各模型R2均低于0.12。研究证实变体LSTM在捕捉长期依赖性方面更具优势,但需解决数据变异性问题以提升可解释性。

  
N. Natarajan | S. Dharshini | M. Vasudevan
印度泰米尔纳德邦波拉奇市马哈林加姆工程与技术学院土木工程系 – 642003

摘要

干旱预测对于早期预警、农业规划和水资源管理至关重要。标准化降水指数(SPI)提供了干旱严重程度和范围的定量衡量标准,有助于为短期和长期干旱事件制定准备和缓解措施。由于SPI估算方法完全依赖于具有时空不一致性的降水记录,因此存在诸多计算挑战。本研究使用了四种深度学习模型——长短期记忆网络(LSTM)、堆叠LSTM(S-LSTM)、双向LSTM(BiLSTM)和堆叠双向LSTM(S-BiLSTM)——基于120年的降雨数据,预测印度哥印拜陀站的不同时间尺度下的SPI值(SPI-1、SPI-3、SPI-6、SPI-9、SPI-12、SPI-18、SPI-24和年度SPI),以评估该地区的气象干旱情况。短期预测(SPI-1)的表现较差(R2 ≤ 0.11,RMSE约为1.0),而BiLSTM和S-BiLSTM略有改进。对于中等时间尺度(SPI-3至SPI-9),S-LSTM的表现更好(R2约为0.62至0.89)。在长期时间尺度(SPI-12至SPI-24)上,S-BiLSTM的表现最佳(R2 > 0.94),表明其能够更好地学习长期依赖关系。然而,年度尺度的干旱预测效果较弱,这是由于关键短期变异性的掩盖作用,导致降雨量接近正常水平。双向和堆叠LSTM模型在计算上更为可靠,能够提供准确、稳定且具有普遍适用性的预测结果,尤其是在SPI-6至SPI-24的时间尺度上。深度学习通过多源预测器提高了干旱预测的准确性,但必须解决数据变异性的问题以确保预测的透明性和可解释性。

引言

干旱的发生频率、影响范围及其后果都非常严重且持续时间长,对生命和资源造成巨大损害。尽管干旱被视为气候变化的直接证据,但由于影响因素的复杂性,确定干旱的实际原因和控制措施极为困难。从技术上讲,当降水量持续低于正常或平均水平时,就称为干旱(Sirdas和Sen 2003)。干旱会导致生产力下降、地表水流量减少、地下水补给减少、野火增多以及水电发电量减少(Ciais等人,2005年;Van Vliet等人,2016年;Lotfirad等人,2021年)。干旱被归类为气象干旱、水文干旱还是农业干旱,取决于其可识别的特征和明显的影响。干旱被认为是气候变化最重要的现实后果之一,需要被识别、分类、追踪并预测未来趋势(Coskun和Citakoglu 2023年)。为了管理和利用水资源并减少损失,监测和预测干旱的发生频率至关重要(Fadaei-Kermani和Ghaeini-Hessaroeyeh 2020年)。许多研究人员通过研究降雨分布异常及其他气象参数,试图理解干旱模式并做出可靠的预测(Hagenlocher等人,2019年;Ravinashree等人,2022年)。这些研究中使用的一些最常用的气象干旱指数包括:侦察干旱指数(RDI)、标准化降水指数(SPI)、侦察干旱蒸散指数(SPEI)、Z分数指数(ZSI)、降雨异常指数(RAI)、干旱面积指数(DAI)、有效干旱指数(EDI)、十分位数指数(DI)、Palmer干旱严重度指数(PDSI)、标准化流量指数(SSI)、流量干旱指数(SDI)和Erinc干旱指数(EAI)。
传统上,线性时间序列模型被用于干旱预测,例如ARMA(Chen等人,2012年;Woli等人,2013年;Chen等人,2016年)、ARIMA(Mishra等人,2007年;Durdu等人,2010年;Barua等人,2012年;Mahmud等人,2016年;Chen等人,2016年;Karthika等人,2017年)以及SARIMA(Abede和Foerch 2008年;Fernandez-Manso等人,2011年;Tian等人,2016年;Mahmud等人,2016年;Alam等人,2014a,b;Mossad和Alazba 2015年;Bazrafshan等人,2015年;Han等人,2013年)。随着计算技术的进步,人工智能(AI)模型的应用日益普及。近年来,机器学习(ML)技术(如人工神经网络(ANN)、遗传编程(GP)、模糊逻辑(FL)、专家系统(ES)、高斯过程(GsP)和支持向量机(SVM)极大地推动了非线性时间序列建模的发展。其中,基于ANN的干旱指数预测方法被广泛采用(Chiang和Tsai 2012年;Woli等人,2015年;Belayneh和Adamowshi 2013年;Kousari等人,2017年;Scibert等人,2017年)。ML模型的一个主要限制是当面临极端复杂事件时,凸优化问题需要两个或更多隐藏层(Agana和Homaifar 2017年)。为应对这一挑战,深度学习(DL)系统应运而生,通过高级抽象和非线性修改来近似复杂函数(Li等人,2020年)。在DL模型中,循环神经网络(RNN)因其在处理序列和时间序列数据方面的有效性而得到广泛应用。然而,RNN也存在一些固有局限性,如梯度消失问题和记忆限制,这使得它们难以学习序列中的长期依赖关系(Burkov 1997年;Latifoglu 2022a,b)。与RNN相比,长短期记忆网络(LSTM)通过增加每个单元的交互次数来克服这些缺点(Sattari等人,2021年)。当关键事件之间的边界和滞后时间不确定时,LSTM算法能够从过去的错误中学习,从而对未来时间序列进行分类和预测(Hochreiter和Schmidhuber 1997年)。
在一项关于使用DL模型进行干旱预测的关键研究中,Poornima和Pushpalatha(2019年)预测了1958年至2014年印度海得拉巴地区的SPI和SPEI指数。在较长时间尺度(如6个月和12个月)上,他们发现LSTM模型的表现优于ARIMA统计模型。Abhirup等人(2020年)使用堆叠LSTM(S-LSTM)预测了澳大利亚新南威尔士州的SPI干旱水平。通过比较S-LSTM与ANN和随机森林(RF)的结果,他们发现深度学习模型的表现优于传统ML模型。在另一项重要研究中,Mokhtar等人(2021年)使用了四种ML技术——卷积神经网络(CNN)、LSTM和极端梯度提升(XGB)——预测1980年至2019年中国青藏高原的SPEI值。结果表明LSTM的表现优于其他模型。Wu等人(2021年)使用CZI作为干旱指数,结合WT、LSTM、ARIMA和独特的WT-ARIMA-LSTM方法分析了中国东北部的干旱情况。与其他模型相比,这种创新混合方法表现出色。Gorgij等人(2022年)研究了LSTM在预测伊朗四个站点月降雨数据下的干旱情况(SPI-3、SPI-6、SPI-9、SPI-12),并将结果与决策树(ET)、向量自回归(VAR)和多变量自适应回归样条(MARS)方法进行了比较,发现LSTM的表现优于其他模型。Docheshmeh等人(2022年)也比较了不同ML模型对SPI-3、SPI-6、SPI-9和SPI-12的预测效果,发现LSTM模型的表现优于MARS、ET和VAR模型。在土耳其萨卡里亚气象站的研究中,Coskun和Citakoglu(2023年)使用LSTM和经验模型分解-极端学习机(EMD-ELM)预测了1个月、3个月和6个月时间尺度的SPI。Lalika等人(2024年)使用MARS、LSTM、SVM、ELM和M5 Tree预测了坦桑尼亚瓦米河流域的SPI-6和SPI-9,发现LSTM在预测降雨时间和降雨量方面最有效。
近年来,几种混合建模技术在干旱预测领域引起了研究关注,特别是Danandeh等人(2023年)和Long等人(2024年)分别使用混合CNN-LSTM模型预测了中国和土耳其各省的干旱指数。Taylan(2024年)利用1991年至2023年的历史月降雨数据,使用SPI和LSTM方法预测了土耳其西北部萨卡里亚盆地九个气象站未来十年的干旱状况。Tugrul等人(2025年)通过小波分解(LSTM-W)和长短期记忆(LSTM-VMD)比较了LSTM和SVM方法预测SPI的效果,认为SVM-W模型的性能更优。Yusuf等人(2025)结合离散小波变换(DWT)和LSTM,基于尼日利亚Badeggi地区1968年至2018年的月降雨数据,预测了3个月、6个月、9个月和12个月时间尺度的SPI,发现W-LSTM的表现优于ARIMA和LSTM。Ma等人(2025)使用CNN-LSTM模型和copula理论预测了中国河南省冬季小麦产量的干旱阈值。
总结最新和相关文献的结论,许多研究者倾向于使用LSTM模型,尽管忽略了其一些固有局限性,如梯度消失和长期依赖关系的记忆限制。与其选择计算复杂的混合模型,不如通过适当改进LSTM的变体来提高其预测能力。文献综述强烈推荐使用LSTM模型进行基于SPI的干旱预测,而LSTM变体的应用仍有待探索。本研究采用LSTM、S-LSTM、BiLSTM和S-BiLSTM模型,预测了印度泰米尔纳德邦哥印拜陀站的SPI-1、SPI-3、SPI-6、SPI-9、SPI-12、SPI-18、SPI-24、SPI-36、SPI-48和年度SPI值。

研究区域和数据收集

哥印拜陀是印度南部的一座城市(北纬11°1′6″;东经76°58′21″),位于泰米尔纳德邦西北部,海拔427米(图1)。该市总面积为642.12平方公里,北部边界与尼尔吉里生物圈保护区相邻,西部和北部边界被西高止山脉覆盖。诺亚尔河作为城市的南部边界,为城市的庞大蓄水系统提供水源。该地区气候炎热

LSTM

长短期记忆(LSTM)算法由Hochreiter和Schmidhuber于1997年提出,是早期深度学习模型的改进版本。传统的RNN模型在尝试预测数年时间序列时面临记忆和梯度消失问题,这些问题促使了该模型的发展。用Hochreiter和Schmidt(1997)的话来说,“LSTM是RNN的复杂扩展”。LSTM的时间序列本质

性能指标

本研究使用的预测模型的稳健性通过文献中常见的五个性能指标进行评估:R平方值(R2)、平均绝对误差(MAE)、NSE、皮尔逊系数(Pearson coefficient)和均方根误差(RMSE)。当r和R2接近1,以及MSE、RMSE和MAE接近0时,性能更好。NSE的值可以在-1到1之间。0.9到1之间的值表示性能优异

较短时间尺度下DL模型对SPI预测的比较

比较了LSTM及其变体在捕捉连续SPI数据中的时间依赖性方面的能力。考虑到在较短时间尺度上捕捉数据变异性的重要性,图7展示了四种DL模型(LSTM、BiLSTM、S-LSTM和S-BiLSTM)预测SPI-1个月值的表现。虽然点围绕参考线的散布表明观测值和预测值之间存在中等程度的相关性,但

结论

本研究使用了四种深度学习模型(LSTM、S-LSTM、BiLSTM和S-BiLSTM)预测不同时间尺度(从1个月到年度)的SPI值。结果表明,短期SPI的预测具有挑战性。所有模型在SPI-1上的表现都较差,R2值极低(≤0.11),RMSE较大(约1.0),这是由于短期降雨变化的随机性和噪声性。BiLSTM和S-BiLSTM略有改进
CRediT作者贡献声明
M Vasudevan:撰写——审稿与编辑、可视化、验证、监督。Narayanan Natarajan:撰写——审稿与编辑、原始草稿、方法论、调查、正式分析、数据整理、概念化。S Dharshini:可视化、验证、正式分析
未引用的参考文献
Abebe和Foerch,2008年;Belayneh和Adamowski,2013年;Seibert等人,2017年;S?rdas和Sen,2003年;Tu?rul等人,2025年。
作者没有需要披露的相关财务或非财务利益。
作者声明在准备本手稿期间未收到任何资金、资助或其他支持。
作者声明本文中不存在可能影响工作的财务利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号