降雨对水质影响的综合分析:水参数相互作用与土地利用的协同效应及管理启示

《Journal of Hydrology》:Rainfall-dependent influence of water parameter interactions and land use on lake water quality: A hybrid ensemble approach and management implications

【字体: 时间:2025年08月07日 来源:Journal of Hydrology 6.3

编辑推荐:

  浊度预测模型与可解释性分析在九龙湾流域的应用研究。摘要:针对九龙湾流域农村地区淡水生态系统的监测需求,对比了LSTM、ED-LSTM、TCN和Informer四种深度学习模型在5分钟间隔浊度预测中的性能,发现Informer和ED-LSTM在短期(NSE=0.83,KGE=0.85)和长期预测中表现最优。通过可解释性分析揭示了时间序列自相关和降雨触发机制的主导作用。

  淡水生态系统与人类生活密切相关,尤其是在农村地区,因此需要先进的工具来监测沉积物动态,这对于水体质量和水生生物健康至关重要。浑浊度作为悬浮沉积物的关键指标之一,被广泛用于监测沉积物动态。本文以香港大屿山地区(LCW)流域为案例研究,探讨了在农村社区依赖河流水资源的背景下,如何实现浑浊度的稳健预测。为了进行多步浑浊度预测,我们采用了四种深度学习(DL)模型:长短期记忆网络(LSTM)、编码器-解码器LSTM(ED-LSTM)、时间卷积网络(TCN)和Informer,这些模型均基于高分辨率(5分钟间隔)的现场水文数据。研究结果表明,Informer在短时预测方面表现出色(NSE = 0.83,KGE = 0.85),紧随其后的是ED-LSTM(NSE = 0.80,KGE = 0.80)。这两种模型在建模时间依赖性方面优于LSTM和TCN,尤其是在长时预测中表现更为突出。此外,通过元素级显著性图,一种模型解释工具,我们揭示了浑浊度的自回归性和降雨触发因素是主要的驱动因素。ED-LSTM和Informer的预测优势源于它们在捕捉逐渐减弱的时间依赖性和识别模型中的物理触发因素方面的能力。这项研究通过弥合预测性能与机制解释之间的差距,推动了深度学习在水文学中的应用,为预测建模提供了新的见解。

随着人口增长对淡水资源的压力加剧,理解水文过程,特别是沉积物动态,对于维持水质和保护水生生物多样性至关重要。然而,通过现场测量获取高时间分辨率的悬浮固体浓度(SSC)数据具有挑战性。由于SSC与浑浊度之间存在强烈的关联性,浑浊度常被用作替代指标。作为衡量沉积物状态的重要指标,浑浊度在评估生态系统健康方面发挥着关键作用。适度的沉积物负荷有助于养分循环和栖息地形成,而过高的浑浊度则会破坏水生生物的生存环境,影响鳃的功能,阻碍光合作用所需的阳光照射,并降低水体在灌溉和饮用方面的可用性。监测这些动态对于实现可持续的水资源管理至关重要,特别是在像香港这样的地区,农村社区和生态系统高度依赖山地河流系统提供的灌溉、文化遗产和生物多样性保护功能。因此,研究自然河流中沉积物的行为对于保护水生态系统具有重要意义。

传统的沉积物监测方法通常依赖于经验模型或基于物理原理的模型,这些方法在捕捉气候、水文和人为因素之间的非线性相互作用方面存在局限。近年来,机器学习(ML)技术,尤其是深度学习(DL),为建模复杂的沉积物输运过程提供了变革性的潜力。深度学习模型自2000年代起被引入时间序列预测领域,特别是在水资源管理和环境工程中,已展现出良好的预测能力。基于循环神经网络(RNN)的神经网络,如长短期记忆网络(LSTM)、门控循环单元(GRU)及其多样化变体,在时间序列预测中表现出潜力,这得益于序列建模的优势。每个时间步的输出会被输入到下一个时间步,使得序列中的误差被共享并进行反向传播。虽然序列建模通常与RNN相关,但观察到卷积神经网络(CNN)也可以用于序列预测,并具备有效的长期记忆能力,如由(Bai et al., 2018)提出的时序卷积神经网络(TCN)。Chen等人(2020)报告称,TCN在日蒸散发估计中表现优于LSTM和传统机器学习方法。近年来,注意力机制在时间序列预测中得到了广泛应用,并被证明具有潜力(Tripathy and Mishra, 2024; Vaswani et al., 2017)。然而,尽管注意力机制的引入为模型带来了新的可能性,但目前大多数研究仍将其与RNN或CNN结合使用,而较少探讨注意力机制本身是否能提升模型性能。此外,基于RNN的序列依赖性记忆仍面临长期记忆消失的问题。基于Transformer的预测模型,如Informer(Zhou et al., 2021)和Corssformer(Zhang and Yan, 2023),仅依赖于自注意力机制,提供了一种超越RNN和CNN的全新预测架构。然而,这些模型尚未广泛应用于水资源领域,且其时间信息损失问题仍未解决。

在不同模型之间的比较研究中,使用多样化的评估方法是一种常见做法(Jing et al., 2023; Shangguan et al., 2023; Yang et al., 2021; Wang et al., 2019)。然而,一些潜在的问题尚未得到充分考虑,例如数据泄露和不确定性(或随机性)评估(Zhu et al., 2023)。数据泄露意味着由于随机分割,已见和未见数据集之间的划分不够严格,而不确定性则来源于随机种子。例如,Khosravi等人(2023)使用三种深度学习模型评估土壤水侵蚀的易感性,但忽略了不确定性,导致结果的可重复性存疑。另一个常被忽视的方面是预测技能在提前时间(lead time)内的变化。由于损失函数将模拟的各个方面归纳为一个单一数值,多步预测通常会被平均处理,从而导致提前时间内的预测结果模糊(Yu and Ma, 2021)。Ham等人(2019)和Li等人(2021b)报告称,预测技能在提前时间内会下降,但这一现象并非普遍适用(Espeholt et al., 2022; Song et al., 2020)。提前时间内的变化可作为不同神经网络架构内部机制的指标,以及科学发现中潜在物理机制的依据(Arrieta et al., 2020)。

由于神经网络的黑箱特性,其可信度和实用性常常受到挑战,这可能会限制其在关键决策过程中的应用(Chakraborty et al., 2021)。在河流系统研究中,这一问题尤为突出,因为理解物理过程与水文因素之间的复杂相互作用需要透明和可解释的模型。可解释模型通过揭示不同特征如何影响水文结果来增强预测的可信度。近年来,神经网络的解释已成为人工智能领域的一个子任务,称为可解释人工智能(XAI)(Samek et al., 2019)。在多种XAI模型中,显著性方法是使黑箱变得透明的一种最直接的方法,因为它强调了对输出至关重要的输入特征(Ismail et al., 2020)。通常有两种主要类型的显著性图:基于梯度的和基于扰动的。基于梯度的显著性方法通过计算预测相对于输入特征的梯度来生成重要性评分,例如集成梯度(Shrikumar et al., 2017)和期望梯度(Erion et al., 2021)。基于扰动的方法则通过在输入中引入扰动,并基于扰动引起的减少来生成重要性评分。例如,特征遮蔽(Suresh et al., 2017)和特征排列。Jing等人(2023)采用了特征排列方法,并报告称人类活动和蒸散发是地下水深度预测的两个最重要因素,但忽略了时间尺度的变化。Jiang等人(2022)使用了基于梯度的方法来分析洪水归因,但特征重要性仅限于单一预测步骤,限制了对序列依赖性的理解。此外,还有其他XAI模型,如基于注意力的可解释性(Ding et al., 2020),但它们通常局限于特定模型,从而限制了其应用范围。回顾所有这些方法,它们提供了解决主要问题的方案:哪些特征是重要的?然而,在不同模型之间的比较中,这种特征级别的问题似乎并不恰当。一个更高级的问题仍未解决:为什么在相同的特征输入下,某些模型在预测方面表现更佳?解答这一问题对于提升可解释性以及优化水文学研究中的预测建模方法至关重要。

在本研究中,我们采用了具有不同架构的神经网络进行序列浑浊度预测,据我们所知,这一研究尚未被广泛开展。高时间分辨率的数据增加了预测的难度,超过了流速预测的挑战(Frame et al., 2022)。由于神经网络结构的多样性以及新模型的快速涌现,我们仅选择了典型的网络架构进行展示和比较(Otero and Horton, 2023)。我们的比较不仅限于预测性能,还涉及模型的可解释性,以解答这一更深层次的问题。

研究区域位于LCW流域的东北部,属于香港新界地区(图1a)。该流域受亚热带气候影响,雨季通常从4月持续到9月,其中降雨最强烈的事件通常发生在5月至8月之间。LCW流域面积为2.5平方公里,地势从4米到411米不等。土地坡度范围从0度到58.2度,平均为22.2度(Lu et al., 2023)。该流域内设有多个监测站点,用于收集水文数据,包括浑浊度、降雨量、流量等。这些站点分布在不同的地理位置,以确保数据的全面性和代表性。通过这些数据,可以更准确地评估流域内的沉积物动态,并为预测模型提供训练和验证的基础。

在模型实施过程中,所有四种模型均进行了10次训练,每次使用不同的随机种子,以遵循(Zhu et al., 2023)提出的建议,对短时和长时浑浊度预测进行评估。学习率和批量大小被设置为0.001和128,以确保模型在训练过程中能够有效收敛。均方误差(MSE)损失函数被用于量化预测与真实值之间的偏差,优化过程则采用Adam优化器。每个模型的参数数量被记录在表2中,以供后续分析和比较。在训练过程中,观察到了三种模型失败的情况,这可能与训练数据的分布、模型结构的选择或优化参数的设置有关。通过进一步的分析,可以识别出这些失败的原因,并为模型改进提供指导。

为了建立预测技能与可解释性之间的桥梁,我们对四种模型进行了模型检查,以探索其在不同时间尺度下的表现差异。通过分析预测结果的不确定性,我们能够评估模型在不同场景下的鲁棒性。此外,通过使用显著性图,我们能够揭示哪些特征对预测结果具有更大的影响,以及这些特征如何与模型的内部机制相互作用。这种分析不仅有助于理解模型的预测能力,还能为未来的模型改进提供依据。通过比较不同模型的预测结果和解释性,我们能够识别出哪些模型在捕捉时间依赖性方面更为有效,哪些模型在识别物理触发因素方面具有优势。这种比较为水文学研究中的预测建模提供了新的视角,并有助于优化模型的性能和可解释性。

通过本研究,我们发现Informer和ED-LSTM在短时预测方面表现优异,这可能与其在捕捉逐渐减弱的时间关系和识别物理触发因素方面的能力有关。相比之下,LSTM和TCN在长时预测中的表现相对不足,这可能与其在处理长期记忆方面的局限性有关。此外,通过显著性图的分析,我们发现浑浊度的自回归性和降雨触发因素是主要的驱动因素,这为理解沉积物动态提供了重要的线索。这些发现不仅有助于优化现有的预测模型,还为未来的模型开发提供了方向。通过结合预测性能和可解释性,我们能够更全面地评估模型的有效性,并为水资源管理提供更可靠的支持。

本研究的结果表明,深度学习模型在水文学中的应用具有广阔前景。通过比较不同模型的预测性能和可解释性,我们能够识别出哪些模型在特定任务中表现更佳,并为模型改进提供依据。此外,本研究还强调了在水资源管理中,模型的可解释性对于提升预测的可信度和实用性至关重要。通过揭示模型的内部机制,我们能够更好地理解沉积物动态,并为水资源保护和管理提供科学支持。这种研究不仅有助于提升预测模型的性能,还能为未来的水文学研究提供新的方法和思路。

总的来说,本研究为水文学中的深度学习应用提供了新的见解,并展示了如何通过结合预测性能和可解释性来优化模型的性能。通过分析不同模型在不同时间尺度下的表现,我们能够更全面地理解沉积物动态,并为水资源管理提供科学支持。此外,本研究还强调了在模型评估中,考虑不确定性、数据泄露和预测技能变化的重要性。通过这些分析,我们能够更好地评估模型的有效性,并为未来的模型改进提供依据。这种研究不仅有助于提升预测模型的性能,还能为水资源保护和管理提供新的方法和思路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号