将SWAT模型与LSTM模型结合,以提升数据匮乏流域的日磷浓度预测精度

《Journal of Environmental Chemical Engineering》:Coupling SWAT and LSTM models for enhanced daily phosphorus concentration forecasting in data-scarce watersheds

【字体: 时间:2026年01月05日 来源:Journal of Environmental Chemical Engineering 7.2

编辑推荐:

  总磷预测模型构建中SWAT-LSTM耦合方法有效提升数据稀缺流域的水质模拟精度至NSE=0.80,并通过SHAP分析揭示地表径流与降水是关键驱动因素,验证了物理模型与数据驱动融合的可行性。

  
修子曦|蒲旺|勇强王|魏展|方刘|春霜刘|秋友刘
中国石油大学(华东)化学与化学工程学院化学安全国家重点实验室,青岛市266580,中华人民共和国

摘要

准确的总磷(TP)浓度建模对于缓解富营养化和流域管理至关重要。然而,数据匮乏的地区带来了挑战:基于过程的模型存在参数不确定性,而数据驱动的方法缺乏物理可解释性。为了利用它们的互补优势,我们开发了一个创新的耦合框架,将土壤和水资源评估工具(SWAT)与长短期记忆(LSTM)神经网络相结合。在伊河盆地(2021-2023年),单独使用SWAT模拟的日TP浓度效果较差(NSE=0.08),这突显了独立物理建模的局限性。对SWAT、LSTM和SWAT-LSTM的系统性比较表明,耦合模型取得了令人满意的验证性能:Nash-Sutcliffe效率(NSE)为0.80,比SWAT提高了0.72,比LSTM提高了0.10。它还具有更好的泛化能力,表现为最低的均方根误差(RMSE)和最小的偏差。数据稀缺性测试证实了SWAT-LSTM在各种情景下的最佳性能和稳定性:即使只保留了40%的训练数据,其NSE仍保持在0.70以上,显示出对有限观测数据的强大适应性。Shapley Additive Explanations(SHAP)分析确定径流和降水量是TP浓度变化的关键驱动因素,这与水文传输在流域TP迁移中的作用一致。在SWAT衍生的水文变量中,侧向流(LAT_Q)和土壤含水量(SW)对于提高耦合模型的准确性至关重要,这强调了将物理机制与数据驱动建模相结合的价值。本研究为数据稀缺的流域提供了一种TP预测框架,并为河流水质管理提供了可行的见解。

引言

磷(P)是一种重要的生物元素,在生物代谢和生态系统功能中起着基础性作用[1]。然而,人类活动显著改变了全球磷循环[2],由于点源(例如磷化工厂)和非点源(主要是农业肥料和畜牧业)的排放,磷的排放量急剧增加[3],[4]。这种过量的磷负荷导致了水生系统的广泛富营养化[5],[6],这是全球最紧迫的环境挑战之一[7]。为了解决这个问题,开发出强大的TP浓度预测模型已成为实施可持续流域管理策略的关键工具[8],[9]。
基于过程的水文模型(PBM)通过复杂的物理过程数学公式来表示流域动态。近几十年来,已经开发了许多PBM,包括土壤和水资源评估工具(SWAT)、水文模拟程序-Fortran(HSPF)和水文局水资源平衡部门(HBV)模型。值得注意的是,SWAT已成为用于河流系统预测的最广泛使用的模型之一[10]。先前的应用展示了其多功能性,例如Daloglu等人[11]评估了伊利湖的长期溶解磷趋势,Fang等人[12]研究了乔克托瓦奇基流域的水质改善。然而,这些模型面临重大挑战:(1)它们的结构复杂性和高参数化要求;(2)在数据稀缺的流域中,关键的水文和水质测量数据缺乏;(3)对复杂的地球化学循环过程的不可避免的简化[13],[14]。这些限制在极端事件期间尤为明显,此时依赖经验或物理方程往往无法捕捉非线性系统行为和动态波动,导致性能大幅下降或模型完全失效[15],[16]。这些限制是当前基于SWAT的建模方法的基本挑战。
机器学习(ML)的最新进展,特别是深度学习(DL)架构,在水文应用中显示出比传统基于过程的物理模型显著的优势。在各种DL方法中,长短期记忆(LSTM)网络、卷积神经网络(CNN)和Transformer模型已成为模拟水文过程和水质动态的强大工具[17]。与传统的神经网络(ANN)和循环神经网络(RNN)相比,长短期记忆(LSTM)网络在捕捉长期序列依赖性方面表现出色。通过结合独特的记忆单元和专门的门控机制(包括输入门、遗忘门和输出门),LSTM有效缓解了梯度消失和爆炸等常见问题。这些优势使LSTM在水文建模任务中具有高度适用性和稳定性。这种能力已在多种应用中得到证明,包括伊利湖的短期藻类爆发预测和太湖的营养物质浓度模拟[18],[19]。尽管取得了这些成功,基于LSTM的方法仍存在根本性限制。作为本质上是数据驱动的模型,LSTM缺乏对物理过程的明确表示,导致模型机制的可解释性有限。它们的性能严重依赖于训练数据的数量和质量,而时间依赖性的内部处理仍然不透明[20],[21]。这些限制显著限制了模型的泛化能力。
将PBM与ML技术相结合的耦合建模方法在水文研究中越来越受到关注。这些耦合框架利用PBM的输出作为ML算法的输入,有效地结合了物理过程理解和数据驱动的模式识别能力[22]。大量证据表明,这种整合可以通过补偿各个模型的局限性、保持物理可解释性和提高预测准确性来协同增强模型性能。例如,Noori等人[23]应用了SWAT-ANN耦合模型来预测美国乔治亚州亚特兰大地区的水质。然而,由于ANN网络结构在处理时间信息方面的固有限制,该耦合模型的泛化能力受到了一定程度的限制。即便如此,其性能仍显著优于单独的SWAT模型。现有研究强调,机器学习模型的性能在很大程度上取决于数据的数量和质量,数据量具有特别显著的影响——研究表明,“简单模型+大量数据”的组合通常优于“复杂模型+有限数据”的组合[24]。例如,Huan等人[25]在数据充足的情况下,使用SWAT-XGBoost-LSTM耦合模型成功模拟了非点源污染对河流的影响,取得了良好的结果。Jeong等人[26]也使用SWAT-LSTM耦合模型预测了流域总磷负荷;通过整合永山河流域五年的日尺度观测数据,他们大幅提高了模型的预测性能。然而,在经济和技术资源有限的地区,河流营养物质的监测不足常常导致观测数据稀缺且质量低下[27]。在这种背景下,本研究专注于数据稀缺流域的总磷模拟。通过在数据稀缺条件下进行有目的的实验,系统地验证了所构建模型是否能够保持高预测准确性和稳定性。本研究开发了一个SWAT-LSTM耦合建模框架,将基于过程的水文建模与深度学习能力相结合,用于伊河盆地的TP浓度预测,该地区的监测数据相对稀缺。所提出的方法系统地将SWAT衍生的流域特征变量与气象数据作为LSTM的输入,明确考虑了气候影响和流域动态。本研究的主要目标如下:(1)研究整合PBM和ML模型以提高流域磷浓度模拟准确性的可行性;(2)验证SWAT-LSTM耦合模型在数据稀缺情况下是否能够保持高预测准确性和良好的稳定性;(3)分析SHAP可解释性工具是否能够揭示SWAT-LSTM耦合模型性能显著提升的潜在机制。

研究区域

研究区域

伊河盆地(YHR)跨越中国东部的山东省和江苏省(34°20'-36°18'N,117°20'-118°44'E),面积为11,466平方公里,本研究特别关注其山东省部分(图1a),主要位于临沂市境内,包括七个县(沂源、沂水、蒙阴、沂南、平邑、肥城和郯城)。该盆地具有明显的西北-东南地形梯度,在其主要是山区和丘陵地带形成了显著的地形起伏。

SWAT模拟结果

SWAT模型具有复杂的参数系统,由许多经验公式驱动,这使得详尽的单独校准在计算上非常密集,并且容易陷入局部最优解。因此,我们使用了SWAT-CUP和SUFI-2算法进行系统的敏感性、校准和不确定性分析,每次迭代使用500次模拟以确保稳定收敛。全局敏感性分析根据t统计量和p值对参数进行了排序(图S5),其中较大的绝对值...

结论

本研究开发并应用了一个SWAT-LSTM耦合模型,并将其性能与单独的SWAT和LSTM模型在模拟伊河盆地TP浓度方面的性能进行了比较。结果显示,单独的SWAT模型拟合能力有限(R2=0.55,NSE=0.08),预测性能不足。相比之下,SWAT-LSTM模型在测试阶段取得了最佳性能(NSE=0.80),显著优于其他两种模型。值得注意的是,它保持了更高的准确性和稳定性。

CRediT作者贡献声明

勇强王:写作——审阅与编辑,资源提供。魏展:概念构思。方刘:资源提供。春霜刘:资源提供。修子曦:写作——原始草稿,可视化,软件,方法论,数据分析,概念构思。蒲旺:写作——审阅与编辑,监督,资源提供,方法论,资金获取,概念构思。秋友刘:资源提供。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了山东省自然科学基金(ZR2024QE286)、中央高校基本科研业务费(24CX06027A)、中国博士后科学基金(2024M763647)、青岛市博士后支持计划(QDBSH20240202087)、山东省泰山学者基金(tsqn202408089)和山东省高等学校青年创新科技项目(2024KJH111)的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号