利用长短期记忆模型预测美国阿拉斯加河流冰情破裂:时空泛化能力与季节性预报应用

【字体: 时间:2025年09月22日 来源:Water Resources Research 5

编辑推荐:

  本综述系统开发了一种基于长短期记忆模型(LSTM)的深度学习算法,利用广泛可获取的气象(Daymet)与地理空间数据(ARCADE),成功预测了阿拉斯加及加拿大西部八大河流的年度冰情破裂时间。模型在23个地点表现出色,平均绝对误差(MAE)为5.40天,平均绝对百分比误差(MAPE)达4.37%,并展现出良好的时空泛化能力。研究进一步整合欧洲中期天气预报中心(ECMWF)的长期季节性预报数据,证实LSTM在提前5个月预测中的实用性,为高纬度地区冰汛洪水预警和河流运输安全提供了重要技术支撑。

  

1 引言

北极地区河流年度冰情破裂可能引发严重的冰塞洪水(IJF),造成财产损失、生态系统改变及居民安全风险。预测年度破裂时间对居民防洪准备及河流运输安全评估具有关键意义。传统研究多集中于单一河流或特定河段,缺乏空间泛化能力,且较少整合长期气象预报数据。本研究旨在开发一种基于长短期记忆模型(LSTM)的深度学习算法,利用广泛可获取的气象与地理空间数据,实现多河流、多区域的冰情破裂预测,并评估其在实际季节性预报中的应用潜力。

2 材料与方法

2.1 研究区域与冰情破裂数据

研究区域覆盖美国阿拉斯加及加拿大西部的八大河流(科珀河、科尤库克河、卡斯科奎姆河、苏西特纳河、塔纳诺河、育空河、巴克兰河和科布克河),共选取33个观测点。冰情破裂日期数据来源于阿拉斯加-太平洋河流预报中心(APRFC)数据库,时间跨度为1980年至2023年。筛选标准为至少35年的有效记录,最终保留33个地点用于分析。

2.2 气象与地理空间数据

气象数据来自Daymet数据库,包括日最低/最高气温(°C)、降水量(mm)、水汽压(Pa)、短波辐射(W/m2)、雪水当量(mm)和日长(秒),空间分辨率为1 km × 1 km。地理空间数据采用泛北极流域数据库(ARCADE),提取了五个静态流域特征参数:水面覆盖率、平均地形湿度指数、流域周长(km)、Gravelius指数和平均坡度。

2.3 长期季节性预报数据

从哥白尼气候变化服务(C3S)气候数据存储库(CDS)获取欧洲中期天气预报中心(ECMWF)的51成员集合季节性预报数据,空间分辨率为1°,时间跨度为2020年至2023年。预报窗口设置为2月至6月每月初开始,至7月1日结束,以覆盖冰情破裂季节。

2.4 数据处理与模型构建

数据预处理包括将儒略日转换为连续时间变量(通过正弦/余弦变换消除年际不连续性),并归一化至[0,1]范围。目标变量为二值向量,标记年度破裂日为1,其余为0。LSTM模型采用457天的回看窗口,确保每个窗口内至少包含一个破裂事件。模型超参数通过贝叶斯优化确定,最终结构包含256个LSTM神经元和256个全连接神经元,使用Adam优化器和二元交叉熵损失函数进行训练。

2.5 模型评估与解释性分析

采用平均绝对误差(MAE)、标准差(STD)和平均绝对百分比误差(MAPE)评估模型性能。使用Shapley值分析变量贡献,并引入时间校正以保持季节性对齐。同时,构建朴素自回归模型(以前一年破裂日预测当年)作为基准对比。

3 结果

3.1 LSTM模型性能

在23个训练地点上,LSTM在测试集(2014–2023年)中的整体MAE为5.40天,STD为4.03天,MAPE为4.37%。最佳预测地点为科尤库克河的Allakaket(MAE=2.70天),最差为塔纳诺河的Nenana(MAE=9.70天)。73%的预测误差在一周内,仅1.8%超过两周。与朴素模型(MAE=7.06天)相比,LSTM误差降低23%。

3.2 独立验证与泛化能力

在10个未参与训练的保留地点上,LSTM的整体MAE为8.46天(STD=6.64天,MAPE=6.92%)。科布克河的Ambler表现最佳(MAE=4.45天),而卡斯科奎姆河的Nikolai误差最大(MAE=20.50天),因其破裂日期显著早于其他地点。朴素模型在保留集上表现略优(MAE=6.70天),但其依赖历史破裂数据,泛化能力受限。

3.3 季节性预报应用

使用ECMWF预报数据时,LSTM在2020–2023年的预测误差为5–14天。2月初开始的5个月预报窗口性能最优(2021年MAE=5.16天),而接近破裂日的预报窗口误差增大。结果表明LSTM在长期季节性预报中具有实际应用潜力。

3.4 Shapley值分析

以育空河的Fort Yukon为例,Shapley值显示气温和降水变量在冰封期和破裂期贡献最大。破裂前2–3周的气温升高和短波辐射增加是关键驱动因素,而冰封前的低温与降水亦对预测有显著影响。

4 讨论

4.1 模型有效性

LSTM在多数河流上表现出高精度预测能力,但数据稀疏性(如塔纳诺河仅一个站点)和地理异质性限制了性能。空间代表性充足的河流(如育空河14个站点)预测误差更低。模型在未见过河流(如苏西特纳河)上仍保持较好泛化能力(MAE=8.43天),体现了其跨区域适用性。

4.2 预报实践与限制

ECMWF数据的低空间分辨率(1°)和预报“跳跃性”是误差来源之一。未来集成中短期高分辨率预报可能进一步提升精度。此外,流域特征数据(ARCADE)的粗分辨率未能充分捕捉局部地形差异,更高分辨率的水文数据有望改善模型表现。

4.3 模型解释性

Shapley值揭示了LSTM对冰封期和破裂期气象条件的依赖性,与物理机制一致(如低温促进冰盖形成,高温触发破裂)。这一发现验证了模型决策的合理性,并为后续机制研究提供了方向。

5 结论

本研究成功开发了一种基于LSTM的河流冰情破裂预测模型,仅依赖广泛可获取的气象数据,即在阿拉斯加地区实现了高精度(MAE=5.40天)和良好的时空泛化能力。通过整合季节性预报数据,模型在提前5个月预测中仍保持实用性能(误差<2周)。Shapley值分析进一步明确了气温和降水在关键时期的主导作用。该模型为高纬度地区的冰汛防灾、生态研究和交通管理提供了可靠工具,并展示了深度学习在地球系统科学中的广泛应用前景。未来工作将聚焦于融合高分辨率水文数据与短期天气预报,以提升预测精度和时效性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号