2015年至2023年间,西非贝宁乌埃梅泛滥平原(Ouémé floodplain)洪水区域的时空变化特征

《Journal of Hydro-environment Research》:Spatio-temporal variability of flooded areas in the Ouémé floodplain (Benin, West Africa) from 2015 to 2023

【字体: 时间:2025年11月24日 来源:Journal of Hydro-environment Research 2.3

编辑推荐:

  本研究针对长江三角洲徐溜泾断面潮汐河流的复杂水动力特性,提出并验证了LSTM-KAN混合模型。该模型通过引入可学习的Kolmogorov-Arnold网络激活函数层,显著提升了短、中、长期径流预测精度,较传统谐波分析(HA)和标准LSTM模型精度提高12.1%-52.8%,且在超长序列预测中表现出更优的鲁棒性。实验表明,LSTM-KAN模型在潮汐周期变化中动态调整特征权重,有效捕捉了潮汐、径流与气象因素的耦合非线性效应。

  在水文和水动力学领域,准确预测潮汐河流的流量是水资源管理、防洪以及生态保护的重要环节。然而,由于潮汐河流的流动动力学受地形、潮汐、径流和天气等多重因素影响,其预测任务具有高度的复杂性和不确定性。传统的预测方法,如谐波分析(HA)和一些固定非线性结构的神经网络模型,常常难以适应这些动态变化的系统,从而限制了其长期预测的准确性和可靠性。为了解决这一问题,本研究提出了一种增强型深度学习模型,即KAN(Kolmogorov-Arnold Network)增强的长短期记忆网络(LSTM),通过将KAN层集成到LSTM网络中,使得模型能够更有效地捕捉非线性动态和长期依赖关系,从而提升预测性能。

### 研究区域与背景

研究区域为长江口的胥江段,该段是中国最大的潮汐河口之一,具有重要的水文和生态意义。该区域的气候条件为亚热带季风气候,夏季炎热多雨,冬季凉爽干燥,年平均气温约为16℃,年降水量在1000至1400毫米之间,主要集中在6月至9月。这些气候特征对河流的水文过程产生显著影响,导致流量呈现出明显的季节性和年际变化。此外,该区域的潮汐波受到河流和海床地形的影响,呈现出非对称的涨落周期。例如,涨潮的平均持续时间为4.3小时,而落潮的平均持续时间为8.1小时,同时潮汐流的涨落时间分别为3.9小时和9.1小时。这种复杂的潮汐与径流相互作用,使得流量预测任务尤为挑战。

### 方法与模型创新

为了应对上述挑战,研究团队设计了一种新的混合模型——LSTM-KAN模型。该模型结合了LSTM的时序编码能力和KAN的函数逼近能力,通过将LSTM的预测头替换为KAN层,提高了模型的非线性表达能力和适应性。KAN网络不同于传统的多层感知机(MLP),其激活函数并非固定在节点上,而是可学习的,分布在模型的边(连接)上。这种设计使得KAN能够在较少参数的情况下,更灵活地捕捉数据中的非线性关系和长期依赖,从而提升预测的准确性和稳定性。

此外,KAN的可学习激活函数基于B样条基函数构建,这些函数可以是线性或非线性的,并且其参数可以动态调整,以适应不同时间尺度的流量变化。这种结构不仅提升了模型的表达能力,还增强了其可解释性,使得模型能够更直观地反映水文过程中的物理机制。例如,通过SHAP分析,可以揭示不同潮汐条件下各输入特征的重要性变化,从而更好地理解模型的决策过程。

### 数据处理与模型训练

研究团队使用了长江口胥江段的实时流量监测数据,并结合了气象数据,包括每日总降水量和平均气温,以评估外部因素对流量的影响。这些数据的时间分辨率达到了每0.5小时一次,提供了丰富的信息来捕捉流量的短期和长期动态。为了确保模型的泛化能力和鲁棒性,数据集被划分为训练集、验证集和测试集,比例为7:1.5:1.5,覆盖了2022年1月1日至2023年12月31日的数据。

在模型训练过程中,使用了Adam优化器和均方误差(MSE)作为损失函数,同时采用了早停机制和学习率调度器来防止过拟合。对于KAN层,其参数包括宽度、网格大小(grid_size)和样条阶数(spline_order),这些参数通过训练过程进行优化,以提升模型的预测能力。LSTM-KAN模型的结构设计为四层LSTM网络,各层的神经元数量分别为64、128、256和128,这种金字塔结构有助于梯度的平滑传播,并使模型能够更好地捕捉不同时间尺度的流量变化。

### 实验结果与分析

实验结果表明,LSTM-KAN模型在短、中、长期预测中均表现出显著的性能优势。与传统的谐波分析(HA)模型相比,LSTM-KAN在短时预测中相对准确率提升了12.1%–35.2%,在中时预测中提升了7%–52.8%。这种性能提升主要归因于KAN层的非线性表达能力和对流量动态的适应性。此外,与传统LSTM模型相比,LSTM-KAN在短时预测中表现出更高的稳定性,RSD(相对标准偏差)更低,表明其预测误差更小且更一致。

在中长期预测中,LSTM-KAN模型在预测精度和稳定性方面均优于其他模型,如XGBoost、DLinear和Informer。例如,在中时预测中,LSTM-KAN的RSD比HA模型低15.1%–31.1%,比LSTM模型低5.4%–15.5%,比XGBoost模型低0.9%–2.8%,比DLinear模型低6.7%–27.3%,比Informer模型低1.1%–2.5%。这种优势表明,LSTM-KAN模型在处理非线性和非平稳的流量数据方面具有更高的效率和适应性。

在长期预测中,LSTM-KAN模型表现尤为突出。在春潮期间,其预测误差(RSD)比其他模型低15.9%–34.4%,在低潮和中潮期间也表现出较高的准确率。这一结果表明,LSTM-KAN模型不仅能够捕捉短期的流量波动,还能够有效识别长期的周期性特征,从而在复杂且动态的潮汐河流环境中实现更准确的预测。

### 模型的可解释性与特征重要性

通过SHAP分析,研究团队进一步探讨了LSTM-KAN模型的可解释性。结果显示,在不同潮汐条件下,各输入特征的重要性存在显著变化。例如,在低潮期间,流速是最重要的预测因子,而在春潮期间,水位和横截面积的重要性显著增加。这种动态的特征重要性变化表明,LSTM-KAN模型能够根据不同的水文条件调整其对输入特征的依赖程度,从而更准确地反映实际的流量动态。

这种可解释性对于理解潮汐河流的水文过程至关重要。传统的深度学习模型,如Informer和标准LSTM,通常被视为“黑箱”,其内部机制难以解析。而KAN的可学习激活函数和B样条结构使得模型的决策过程更加透明,有助于揭示潮汐与径流之间的物理机制。例如,模型在春潮期间对水位和横截面积的依赖性增加,可能反映了此时水位变化剧烈,横截面积也随之发生显著变化,从而影响流量的波动。

### 与已有研究的比较

与其他研究相比,LSTM-KAN模型在多个方面展现了优势。首先,与传统的谐波分析(HA)模型相比,LSTM-KAN模型能够更有效地捕捉非线性和非平稳的流量动态,从而提升预测的准确性。其次,与基于Transformer的Informer模型相比,LSTM-KAN模型在短时和长期预测中均表现出更高的准确率,这表明其在处理不同时间尺度的流量变化方面具有更强的适应性。此外,与XGBoost模型相比,LSTM-KAN模型在中长期预测中表现出更稳定的性能,说明其在处理复杂时间序列数据时具有更好的鲁棒性。

### 统计显著性分析

为了验证LSTM-KAN模型的性能优势,研究团队进行了Wilcoxon符号秩检验。该检验表明,LSTM-KAN模型在所有预测时间段内均表现出显著的性能提升(p < 0.05)。在短期预测中,其性能显著优于传统模型(如T-Tide和LSTM),而在中长期预测中,其性能与XGBoost和Informer模型相近,但依然保持较高的准确率。这一结果表明,LSTM-KAN模型在处理不同时间尺度的流量预测时具有广泛的适用性。

### 预测时间与模型性能的关系

研究还分析了预测时间对模型性能的影响。结果显示,当预测时间为48小时时,LSTM-KAN模型的预测误差(RSD)达到最低,为5.4%。随着预测时间的延长(如96小时和192小时),RSD逐渐增加,分别为6.3%和7.1%。然而,在较短的预测时间(如24小时)中,RSD同样较高,为6.7%。这表明,模型在处理长期预测时表现更为优异,而在短期预测中仍面临一定的挑战。这可能与模型在处理长期数据时的结构设计有关,同时也反映出在不同时间尺度下,流量动态的复杂性。

### 理论优势与应用前景

KAN架构的引入不仅提升了模型的预测性能,还带来了理论上的优势。首先,KAN的可学习激活函数使得模型能够更直观地反映水文过程中的物理机制,为模型的可解释性提供了支持。其次,KAN在参数效率和模型鲁棒性方面表现出色,能够在较少参数的情况下实现更精确的预测,这对于水资源管理中的实际应用具有重要意义。最后,KAN的适应性非线性能力使得模型能够更好地捕捉潮汐与径流之间的复杂相互作用,为未来的研究提供了新的思路。

### 结论

本研究提出的LSTM-KAN模型在长江口胥江段的流量预测中表现出显著的优势。它不仅提升了模型的预测精度,还增强了其对非线性和非平稳数据的适应能力。研究结果表明,KAN层的引入使得模型能够更有效地捕捉潮汐河流中的复杂动态,为水文预测提供了一种新的解决方案。此外,LSTM-KAN模型的可解释性和参数效率使其在实际应用中具有更大的潜力,尤其是在需要对流量变化进行动态分析的场景中。

尽管LSTM-KAN模型表现出色,但研究也指出了其局限性。目前模型主要基于单一监测站点的数据进行训练和验证,其在其他具有不同水文特征的潮汐系统中的泛化能力仍需进一步研究。此外,未来的研究可以探索如何将更多外部驱动因素(如上游径流)纳入模型,以提升其预测能力。同时,可以进一步优化模型的超参数,以充分发挥其在复杂水文系统中的潜力。

总的来说,LSTM-KAN模型为潮汐河流的流量预测提供了一种新的思路,其在准确性、鲁棒性和可解释性方面均表现出色。这一模型的提出不仅推动了深度学习在水文学中的应用,也为其他非线性环境系统的预测任务提供了有价值的参考。未来的研究可以进一步拓展该模型的应用范围,探索其在多站点、多变量预测中的表现,以更好地服务于水资源管理和防洪预警等实际需求。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号