基于Mamba与深度门控注意力层的双通道并行月径流预测模型MamGA及其在水文预报中的应用

【字体: 时间:2025年09月24日 来源:Journal of Hydrology: Regional Studies 4.7

编辑推荐:

  本研究提出新型双通道并行深度神经网络架构MamGA,融合选择性状态空间模型(Mamba)与深度门控注意力层(Depth-gated Attention),显著提升月径流预测精度与计算效率,为水资源管理提供强有力技术支撑。

  

Section snippets

Tools and techniques

本节将阐述构建MamGA模型的核心技术与方法。首先明确月径流预测任务定义及模型输入输出变量,随后详细介绍MamGA模型的嵌入式编码层(Embedded Coding layer)、特征融合预测层(含Mamba层与深度门控注意力层)以及时序解码层(Sequential Decoding layer)的架构设计。最后说明模型训练策略与评估指标体系。

Study area

本研究选取具有显著下垫面与径流特征差异的澜沧江流域(中国)与雷溪流域(美国)开展实验,重点分析曼湾站(MW)、小湾站(XW)和雷溪站(TC)的预测表现。这些站点兼具水文复杂性与数据可获得性,为验证模型泛化能力提供理想场景。

MamGA model parameterization

模型涉及学习率、丢弃率(dropout)、隐藏层数等9个关键超参数。采用粒子群优化算法(PSO)以平均绝对误差(MAE)为指标进行参数寻优,确保模型性能最优化。参数敏感性分析表明,隐藏层维度与注意力头数对预测精度影响最为显著。

Discussion

基于实验结果,从模型创新性、适应性与应用价值多维度系统分析:

  1. 1.

    模块协同效应实验表明Mamba与深度门控注意力的互补性;

  2. 2.

    在极端水文事件与不同时间尺度下均保持稳定性能;

  3. 3.

    相比Transformer显著降低计算复杂度(线性vs二次);

  4. 4.

    为数据稀缺区域提供轻量化解决方案。

Conclusions

MamGA模型通过选择性状态空间框架与深度门控注意力层的融合,显著增强长程依赖捕获能力与全局特征处理效率,同时实现双向信息依赖建模。嵌入式编码与时序解码层的引入进一步优化复杂水文过程表征精度,为中长期径流预测提供创新性技术路径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号