MonoGRU：一种简化型门控循环单元在降雨预报中的理论与实证评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Science of The Total Environment》：MonoGRU: A theoretical and empirical evaluation of a streamlined gated recurrent unit for rainfall forecasting

【字体：大中小】 时间：2026年01月06日 来源：Science of The Total Environment 8

编辑推荐：

　　本文提出一种高效的单门控GRU（MonoGRU）模型用于降雨预测，通过优化门控结构减少参数数量并增强梯度稳定性，在42年 Cox's Bazar 数据集上验证其准确性（MAE 4.73-4.06，R2 0.687-0.721）和计算效率（较标准GRU减少33%参数），并建立理论稳定性分析。摘要

孟加拉国锡尔赫特市大都会大学电子工程与计算机科学系（Department of EEE, Metropolitan University, Sylhet），邮编3104

摘要

准确的降雨预测是气候分析和灾害管理的关键组成部分，直接影响农业规划、水资源管理和洪水缓解策略。在这项研究中，我们提出了一种基于MonoGRU（GRU：门控循环单元）的高效降雨预测模型，该模型在准确性和计算效率方面进行了优化。该模型利用门控循环架构有效地捕捉时间序列数据中的时间依赖性，同时与传统GRU模型相比显著减少了可训练参数的数量。通过向前预测交叉验证（walk-forward cross-validation）的实验评估表明，MonoGRU在平均绝对误差（MAE）、均方误差（MSE）、均方根误差（RMSE）和R2分数等关键性能指标上始终优于GRU模型。Q-Q图分析突显了MonoGRU在匹配理论和样本分位数方面的稳健性，特别是在高训练周期设置下，表明其具有更高的预测可靠性。进一步比较模型复杂性发现，MonoGRU的内存占用和计算开销更低，使其非常适合资源有限的环境。通过结合轻量级设计和高准确性，这项工作为降雨预测提供了一个可扩展的解决方案，为更高效的预测系统铺平了道路。本研究的结果强调了MonoGRU扩展到其他时间序列预测领域的潜力，并鼓励进一步探索其能力。

引言

降雨预测对于缓解气候变化带来的日益严峻的挑战至关重要，例如洪水、干旱和地下水枯竭，这些挑战对农业、水资源和公共卫生产生了重大影响（Barrera-Animas等人，2022年；Le等人，2020年；Pasquini等人，2020年；Pedro-Monzonís等人，2015年）。在农业领域，准确的降雨预测有助于灌溉规划、播种和收获，从而降低对粮食安全和经济稳定的风险（Polisetty和Ebenezer，2021年）。水文应用，包括洪水预测和可持续水资源管理，严重依赖精确的预测来减少灾害风险并有效管理水资源（Bazrafshan等人，2024年；Monir等人，2023年；Vivas等人，2023年）。由于人口增长和工业化，对自然资源的压力不断增加，这进一步凸显了需要依赖可靠降雨预测的可持续水资源管理系统（Alamgir等人，2020年；Ashok和Pekkat，2022年；Mohsenipour等人，2020年；Ridwan等人，2021年）。然而，由于气象数据的动态和非线性特性（受温度、湿度和大气压力等因素影响），降雨预测仍然具有挑战性（G等人，2023年；Jamei等人，2023年；Lama等人，2022年；Lim和Zohren，2021年），传统的统计模型（如ARIMA（自回归积分滑动平均）和SARIMA（季节性自回归积分滑动平均）因其能够有效建模线性时间依赖性而被广泛用于降雨预测（Ashwini等人，2021年；Minh等人，2024年；Shad等人，2022年）。机器学习（ML）模型，如支持向量机（SVM）、决策树（DT）、随机森林（RF）和梯度提升方法（例如XGBoost）也被应用于降雨预测（Appiah-Badu等人，2022年；Latif等人，2023年；Yin等人，2022年）。然而，无论是统计模型还是传统的ML模型，在应用于降雨预测时都面临显著的限制。ARIMA和SARIMA严重依赖于数据中的线性关系和平稳性假设，这往往无法捕捉降雨模式的非线性和动态特性。同样，传统的ML模型并未专门设计来处理时间序列数据中的序列依赖性。这些模型需要特征工程来编码时间关系，这可能既费时又容易出错（Adnan等人，2021年；Frame等人，2022年；Ouma等人，2022年）。这些挑战为深度学习模型的采用铺平了道路，深度学习模型专门设计用于解决这些不足（Rizvee等人，2020年）。人工神经网络（ANN）因能够建模非线性关系而在降雨预测中得到广泛应用。与传统统计模型相比，ANN在准确性方面有所提高，尤其是在短期预测方面（Hossain等人，2020年；Santaray等人，2020年；Zhang等人，2020年）。然而，ANN缺乏捕捉时间序列数据中时间依赖性的机制，因为它们独立处理输入，从而降低了其在序列预测中的有效性，并增加了大规模数据集的计算成本（Arleena Masngut等人，2020年；Liu等人，2019年；Sarker和Matin，2023年）。这些限制推动了更先进架构的发展，如循环神经网络（RNN），这些架构专门设计用于处理序列数据和时间模式（Balluff等人，2017年；Basha等人，2020年）。RNN能够有效捕捉时间依赖性，但存在梯度消失的问题，限制了它们对长期依赖性的建模能力（Q. Guo等人，2024年；Nketiah等人，2023年；Ouma等人，2022年）。长短期记忆（LSTM）网络通过记忆单元和门控机制解决了这一问题，但其高计算复杂性和漫长的训练时间对大规模降雨预测任务构成了挑战（Chen等人，2022年；Y. Guo等人，2023年；Jiang等人，2023年；Sorkun等人，2020年）。门控循环单元（GRU）通过更少的参数简化了这一问题，提供了更快的训练速度（Gao等人，2020年；Gharehbaghi等人，2022年；Sun等人，2021年；Xu等人，2024年）。然而，GRU在处理高度非线性或混沌的降雨模式时可能会遇到困难，从而限制了其在复杂预测场景中的预测准确性（W. Wang等人，2024年；Yan等人，2023年）。改进的GRU通过提高效率、捕捉非线性模式和处理混沌数据（通过简化的门控和混合模型）来改善降雨预测，确保了更好的准确性和可扩展性（Alsulami等人，2024年；Y. Wang等人，2024年；Yigit和Amasyali，2021年）。

为了克服这些挑战，研究人员探索了几种旨在提高效率的GRU改进方法。最小门控单元（MGU）去掉了重置门，仅依赖一个门来调节先前隐藏状态对候选状态的贡献，并在候选状态和先前状态之间进行插值（Zhou等人，2016年）。后续的工作提出了简化版本（MGU1、MGU2、MGU3），在保持这种基本结构的同时进一步减少了参数化（Heck和Salem，2017年）。简化的GRU变体放大了当前单元和循环单元的效果，并在情感分析、语言建模、加法和问答等任务上始终优于标准GRU（Yigit和Amasyali，2021年）。简单循环单元（SRU）采取了不同的方法，通过遗忘门和输入门重新设计了循环机制，以强调并行性和训练效率（Lei等人，2018年）。GRU的其他门控变体，如GRU1和GRU2（Dey和Salem，2017年），进一步简化了门控操作，但并未完全统一它们。

尽管这些模型提供了宝贵的见解，但它们主要是通用架构。它们并没有直接解决长序列水文气象预测的特定领域需求，在这些领域中，数十年的数据稳定性和鲁棒性至关重要。在这种情况下，我们提出了MonoGRU，这是一种为时间序列预测设计的精炼的单门循环单元。MonoGRU遵循MGU开创的单门理念，但引入了几项关键改进：（i）一个统一的单门，用于控制候选状态的调节和状态混合，并通过定制的初始化策略实现（输入到隐藏权重的Glorot均匀初始化和循环权重的正交初始化）来增强梯度稳定性；（ii）一个理论稳定性分析，确保在长序列中梯度传播有界；以及（iii）在42年的水文气象数据集上的严格评估，包括与基础模型的比较。这些设计选择使MonoGRU特别适合降雨预测，在这里效率、稳定性和准确性同样重要。该模型使用来自孟加拉国Cox's Bazar的降雨数据集进行评估，数据集涵盖了1981年至2022年的时间范围，为稳健分析提供了全面的时间记录。我们进行了探索性数据分析（EDA）以发现数据集中的模式、趋势和异常，然后使用向前预测交叉验证和多种误差指标（MAE、MSE、RMSE、R2）对MonoGRU与标准GRU和其他基线进行了严格评估。总之，本文的主要贡献如下：

•

提出了MonoGRU，这是一种将重置和更新功能合并到一个统一单门中的GRU变体。与早期的简化GRU模型不同，MonoGRU采用了以稳定性为重点的权重初始化（Glorot均匀和正交初始化），并得到了关于长序列梯度稳定性的理论讨论的支持。

•

在孟加拉国Cox's Bazar的42年单变量降雨数据上提供了全面的实证评估，其中使用向前预测交叉验证和多种误差指标将MonoGRU与基础GRU模型进行了比较。

•

证明MonoGRU在需要较少参数和计算量的情况下实现了可比的预测准确性（与GRU相比减少了约33%），从而为水文气象预测任务提供了一个轻量且稳健的替代方案。

方法部分

方法论

本节概述了构建和评估所提出的MonoGRU（Mono Gated Recurrent Unit）模型以及将其与GRU（Gated Recurrent Unit）模型进行比较以预测降雨的系统性方法。图1提供了完整工作流程的示意图，以便更好地理解和可视化这一过程。

结果与讨论

本节展示了所提出的MonoGRU模型与标准GRU模型在降雨预测方面的评估结果，并通过定量和定性证据详细讨论了MonoGRU在解决GRU局限性方面的有效性。需要注意的是，降雨数据集在预处理期间已经过验证，以确保完整性和可靠性。本节的重点在于评估

结论与评论

本研究介绍了MonoGRU作为GRU的改进版本，用于降雨预测，展示了其在多个指标上的优越性能。在256个单元的配置下，MonoGRU的测试RMSE为7.0197，MAE为4.7314，MSE为49.2764，R2分数为0.6870，在100个周期时显示出比标准GRU更好的准确性。在512个单元的配置下，MonoGRU的测试RMSE为6.4350，MAE为4.0569，MSE为41.4090，R2分数为0.7211，同样表现出色

局限性

尽管结果令人鼓舞，但本研究仍存在某些局限性。首先，分析基于单一区域数据集（Cox's Bazar的降雨数据，1981–2022年），这可能限制其在其他地区的适用性。尽管如此，MonoGRU框架可以在其他地区进行推广。其次，仅考虑了单变量降雨输入，排除了温度、湿度和压力等潜在有用的预测因子。第三，实验基线仅限于GRU；需要更广泛的

作者贡献声明

沙德曼·沙基布博士（Md. Shadman Shakib）：撰写 – 审稿与编辑，撰写 – 原稿，可视化，验证，软件，方法论，调查，正式分析，数据整理，概念化。艾亚库布·阿里博士（Md. Eyakub Ali）：撰写 – 审稿与编辑，撰写 – 原稿，可视化，资源，方法论，调查，数据整理，概念化。纳比尔·H·布伊扬（Nabil H. Bhuiyan）：撰写 – 审稿与编辑，撰写 – 原稿，可视化，监督，软件，项目管理，

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

我们感谢国家关键研究与发展计划的财政支持，具体体现在项目2023YFA1609202下，该项目是重大科学研究设施前沿研究特别项目的一部分。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号