
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CNN耦合双路径LSTM网络的时空迁移学习模型在多步水质指数预测中的创新应用
【字体: 大 中 小 】 时间:2025年06月27日 来源:Journal of Hydrology: Regional Studies 4.7
编辑推荐:
本研究针对马来西亚Klang河流域水质监测中数据缺失和季节性水文变化等挑战,开发了一种结合1D-CNN与双路径LSTM的混合深度学习框架,通过时空迁移学习技术实现多步WQI预测。模型在数据稀缺环境下展现出强大适应性,预测MAPE低于5%,KGE值达0.36-0.67,为热带季风区河流管理提供了动态监测新工具。
在热带地区河流管理中,水质指数(WQI)的动态预测长期面临数据缺失、季节性水文模式多变等挑战。传统方法难以捕捉非线性的水质参数互作关系,而单一深度学习模型又存在特征提取不全面的局限。更棘手的是,监测站常因设备故障或极端天气导致数据中断,使得模型训练陷入"数据荒"。马来西亚Klang河作为该国污染最严重的河流之一,其水质波动直接影响700万人口供水安全,亟需能适应数据稀缺环境的智能预测系统。
为解决这些难题,来自马来西亚的研究团队在《Journal of Hydrology: Regional Studies》发表创新研究,提出CNN耦合双路径LSTM的时空迁移学习框架。该研究通过1D-CNN提取水质参数间的互作特征,结合LSTM捕捉时间依赖性,并创新性地引入双路径LSTM架构(LSTM-1保留历史知识,LSTM-2学习新数据模式),实现知识跨时期迁移。关键技术包括:基于Klang河监测站2019-2021年的AN、BOD等6参数日尺度数据,采用变分模态分解去噪和滑动窗口生成训练样本;构建1D-CNN(32个核)与LSTM(40单元)混合模型;设计四种迁移策略对比,最终通过双路径LSTM的滚动预测验证模型稳定性。
模型构建与验证方面,研究首先在完整数据集上对比6种深度学习模型。结果显示CNN-LSTM混合模型以MAPE 1.88%、KGE 0.61显著优于单一模型,证实CNN提取空间特征与LSTM捕捉时序模式的协同效应。在迁移学习实验中,传统微调策略出现性能下降(CNN微调导致KGE=-0.6),而双路径LSTM通过并行处理源域和目标域知识,实现MAPE 1.71%和KGE 0.43的稳定表现。值得注意的是,该模型仅需2个月目标域数据即可完成适配,较传统方法训练效率提升40%。
跨时期验证部分,模型在9个月测试中展现出惊人鲁棒性:MAPE维持在1.57-3.66%,KGE值(0.36-0.67)远超-0.41的基准线,尤其在季风期污染物稀释阶段仍能跟踪WQI突变。与全球同类研究相比,该模型将DO预测误差从文献报道的6.94%降至3%以下,且首次实现多参数到WQI的间接趋势预测。
这项研究的突破性在于:首创性地将双路径LSTM架构引入水质预测领域,通过"历史记忆"与"实时学习"的并行机制,有效解决概念漂移难题;开发出适应数据缺失场景的轻量化模型,仅需2年训练数据就能实现跨年度预测;为热带季风区河流管理提供可解释的决策工具,如预测结果可直接对应马来西亚DoE-WQI的5级分类标准。未来该框架可扩展至其他水文敏感区,其动态迁移机制也为处理非平稳环境数据提供了新范式。
生物通微信公众号
知名企业招聘