
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Mamba与深度门控注意力层的双通道并行月径流预测模型MamGA及其在水文预报中的应用
【字体: 大 中 小 】 时间:2025年09月24日 来源:Journal of Hydrology: Regional Studies 4.7
编辑推荐:
本研究提出新型双通道并行深度神经网络架构MamGA,融合选择性状态空间模型(Mamba)与深度门控注意力层(Depth-gated Attention),显著提升月径流预测精度与计算效率,为水资源管理提供强有力技术支撑。
Section snippets
Tools and techniques
本节将阐述构建MamGA模型的核心技术与方法。首先明确月径流预测任务定义及模型输入输出变量,随后详细介绍MamGA模型的嵌入式编码层(Embedded Coding layer)、特征融合预测层(含Mamba层与深度门控注意力层)以及时序解码层(Sequential Decoding layer)的架构设计。最后说明模型训练策略与评估指标体系。
Study area
本研究选取具有显著下垫面与径流特征差异的澜沧江流域(中国)与雷溪流域(美国)开展实验,重点分析曼湾站(MW)、小湾站(XW)和雷溪站(TC)的预测表现。这些站点兼具水文复杂性与数据可获得性,为验证模型泛化能力提供理想场景。
MamGA model parameterization
模型涉及学习率、丢弃率(dropout)、隐藏层数等9个关键超参数。采用粒子群优化算法(PSO)以平均绝对误差(MAE)为指标进行参数寻优,确保模型性能最优化。参数敏感性分析表明,隐藏层维度与注意力头数对预测精度影响最为显著。
Discussion
基于实验结果,从模型创新性、适应性与应用价值多维度系统分析:
模块协同效应实验表明Mamba与深度门控注意力的互补性;
在极端水文事件与不同时间尺度下均保持稳定性能;
相比Transformer显著降低计算复杂度(线性vs二次);
为数据稀缺区域提供轻量化解决方案。
Conclusions
MamGA模型通过选择性状态空间框架与深度门控注意力层的融合,显著增强长程依赖捕获能力与全局特征处理效率,同时实现双向信息依赖建模。嵌入式编码与时序解码层的引入进一步优化复杂水文过程表征精度,为中长期径流预测提供创新性技术路径。
生物通微信公众号
知名企业招聘