亚北极和北极地区的雪水当量预测:高效的循环神经网络方法
《Environmental Modelling & Software》:Snow water equivalent forecasting in sub-arctic and arctic regions: Efficient recurrent neural networks approach
【字体:
大
中
小
】
时间:2025年09月27日
来源:Environmental Modelling & Software 4.6
编辑推荐:
本研究系统比较了GRU与LSTM在雪水当量(SWE)预测中的性能,发现GRU在效率与准确性上更具优势。提出轻量级(321参数,NSE 0.91)和复杂度较高的GRU模型(51973参数,NSE 0.95),验证其跨地理区域(如芬兰南、北、中部)的泛化能力,并引入时间向量表示(Time2Vec)优化预测。实验表明GRU在减少模型参数的同时保持高精度,且模型能有效应对不同气候条件下的SWE动态变化。
在北极和亚北极地区,雪水当量(SWE)的预测一直是一个长期存在的挑战。SWE是这些地区水文研究和工程中的关键指标,因为它表达了积雪层中储存的液态水量。众所周知,融雪水补给含水层、控制植物动态,并影响生态系统、土壤碳循环、河流洪水和水力发电。除了积雪层中的水量,最小和最大SWE的时间点也很重要,因为它们会影响地表水与地下水的相互作用、流域内的营养物输出以及洪水峰值的时间。本文旨在通过系统比较门控循环单元(GRU)和长短期记忆(LSTM)架构,展示GRU模型在计算效率方面具有优势,同时保持与LSTM相当的预测精度。
为了提高SWE预测的准确性,我们引入了两种基于GRU的新模型:一种是轻量级模型(321个参数,平均NSE为0.91),另一种是更为复杂的模型(51973个参数,平均NSE为0.95)。这些模型在地理上相距甚远的站点之间表现出良好的泛化能力,证明了它们在不同气候条件下具有强大的预测性能。本研究的主要创新点在于识别出GRU作为SWE预测的一种计算效率高且准确的替代方案,同时展示了具有较小隐藏状态的紧凑架构能够实现强大的空间泛化能力。
本文还介绍了用于本研究的软件“swe-rnn”,由Miika Malin开发,支持模型的保存和加载。该软件基于TensorFlow 2.5.0平台,使用Python 3.8.10版本进行开发,并且在虚拟环境中安装了其他依赖项。此外,我们还对模型进行了详细的分析,并结合了实际数据,包括芬兰南部、北部和中部三个研究站点,这些站点代表了不同的气候条件。通过使用真实世界数据,我们展示了模型在预测SWE方面的准确性和泛化能力。
在方法部分,我们介绍了多层感知机(MLP)和基于度日的模型作为基准模型。此外,我们还探讨了RNN架构(包括LSTM和GRU)以及时间到向量表示(Time2Vec)的使用。Time2Vec是一种时间特征的向量表示方法,它利用正弦函数和可学习参数来捕捉时间依赖关系中的周期性和非周期性模式。研究表明,Time2Vec在时间序列问题中能够提高预测准确性。
在实验设计部分,我们详细描述了研究站点的选择及其数据的预处理过程。为了确保数据集能够涵盖各种自然环境,我们选择了三个位于芬兰的站点:Lohja、Vaala和Inari。这些站点位于60°至69°的纬度范围内,地理距离较远,大约500公里。我们还对站点之间的降水和温度差异进行了统计分析,并在表1中展示了这些数据。
数据预处理是模型训练的重要环节,包括处理缺失值和特征选择。由于SWE的测量间隔较长,我们采用度日模型进行数据插补,以确保模型能够学习到时间序列的周期性。我们还对输入特征进行了选择,如温度、降水和历史SWE值,并对它们的权重进行了调整,以提高预测精度。
模型训练过程中,我们使用了不同的方法,包括随机森林、支持向量机(SVM)和贝叶斯优化等。对于轻量级模型,我们采用了8个隐藏单元,而在较复杂的模型中则使用了128个隐藏单元。这些模型的训练和验证过程展示了它们在预测SWE方面的性能,包括模型效率和预测精度的比较。
在结果部分,我们展示了不同模型在预测SWE时的表现。其中,基于GRU的模型在预测精度和计算效率方面均优于基于LSTM的模型。此外,通过引入Time2Vec层,我们进一步提高了模型的预测能力,尤其是在跨站点预测时。尽管Time2Vec层在某些情况下导致了预测误差的轻微增加,但整体来看,它对模型的性能提升具有重要意义。
讨论部分强调了GRU在SWE预测中的优势,尤其是在处理时间依赖性和计算效率方面。我们还分析了不同输入特征对预测精度的影响,发现温度和降水是影响SWE预测的关键因素。此外,我们讨论了模型在不同气候条件下的泛化能力,以及在实际应用中可能面临的挑战。
结论部分总结了本研究的主要发现,即GRU在SWE预测中表现出良好的计算效率和预测精度,且在跨站点预测中具有强大的泛化能力。轻量级模型和重模型分别实现了平均NSE为0.91和0.95的高精度预测,这为SWE预测提供了一种高效的解决方案。此外,我们强调了未来研究的方向,包括对更多站点数据的使用、对长时预测能力的探索以及对模型可解释性的进一步研究。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号