农村地区浊度预测深度学习模型的互比分析与机制解释
《Journal of Hydrology》:Inter-comparison and mechanistic interpretation of deep learning models for turbidity prediction in rural areas
【字体:
大
中
小
】
时间:2025年08月07日
来源:Journal of Hydrology 6.3
编辑推荐:
本研究通过构建BN-XGB集成模型,结合结构方程模型(SEM)和SHAP解释,分析降雨模式对洪泽湖水质的动态影响。结果表明,溶解氧(DO)响应短时降雨,营养盐受中期降雨调控,藻类指标与前期干旱天数相关。土地利用类型(如人工地表、水域和农田)在不同降雨强度下呈现污染源汇转换特征,其中农业用地超过60%会导致严重富营养化。该框架为湖泊管理提供了可复制的方法支持
本研究旨在探讨水文参数相互作用与土地利用如何在不同降雨模式下影响湖泊水质。这一研究对于水资源管理和生态可持续性具有重要意义。然而,以往的研究多集中在静态条件下的分析,缺乏对降雨模式变化如何动态影响这些因素的系统研究。因此,本研究构建了一个结合贝叶斯网络与极端梯度提升(BN-XGB)集成模型的方法框架,以描述降雨依赖性的自然与人为因素对水质的影响。通过结构方程模型(SEM)确定模型结构,并利用夏普利加性解释(SHAP)进行模型解释。该方法在洪泽湖进行了验证,利用六个监测站的每日水质数据,分析了降雨对水体中不同污染物的响应特征。
研究结果表明,BN-XGB模型在预测水质方面优于单一模型,其相关系数达到了0.79至0.91,纳什-苏特cliffe效率系数则在0.61至0.82之间。这一模型能够捕捉复杂的时序模式,揭示溶解氧(DO)对短期降雨(3天内)的响应,营养物质对中期降雨模式(7至15天)的响应,以及藻类指标对干旱天数的响应。同时,研究还发现,DO对氨氮(AN)的正向影响随着降雨量的增加而减弱,而总氮(TN)和总磷(TP)则表现出相反的趋势。在干旱期间,DO在藻类生长中占据主导地位(占比达90%),而在降雨持续时间较长的情况下,营养物质的积累成为控制藻类生长的主要因素。
此外,研究还揭示了不同土地利用类型在不同降雨条件下的污染特征。在低降雨量情况下,人工地表、水体和农田可能成为污染的“汇”,而在降雨量增加时,这些区域则可能转变为污染的“源”,对营养物质和藻类生长贡献超过40%。然而,在强降雨或暴雨后,这些区域又会重新转变为污染的“汇”。这表明,降雨模式的变化对污染物的迁移和转化具有显著影响,进而改变土地利用对水质的调控机制。
研究进一步指出,DO和AN对土地利用变化的敏感性较低,而TP和TN在农业和城市主导的情境下表现出严重恶化,超过70%和45%的记录显示水质低于V类标准。当农田面积超过60%时,富营养化风险显著上升。相反,在生态保护情境下,水质得到明显改善,并在平衡的情境下达到最佳状态。这表明,土地利用类型和降雨模式的相互作用对湖泊水质具有深远影响,不同土地利用类型在不同降雨条件下可能对水质产生不同的作用机制。
研究团队还强调,水体中多种参数之间存在复杂的相互关系,例如化学需氧量(COD)作为有机污染的重要指标,反映了水体中有机物的氧化需求。当COD浓度升高时,可能会导致水体中溶解氧的消耗超过供给,从而形成缺氧环境。氮和磷作为藻类生长的关键营养物质,通常会加速藻类繁殖,提高叶绿素浓度,进而引发藻类水华。这些水华现象可能会降低太阳辐射的穿透能力,影响水生植物的光合作用,从而减少溶解氧的生成,抑制藻类的进一步生长。然而,以往的研究在分析自然因素对水质的影响时,往往忽略了这些水体参数之间的相互关系。
为了解析影响水质的因素,研究团队采用了一种混合方法,结合基于过程的物理模型和数据驱动的机器学习方法。物理模型主要依赖于守恒方程来模拟水质的动态变化和污染物的迁移过程,但在参数化过程中较为耗时,且在缺乏高精度物理参数的情况下并不适用。相比之下,数据驱动的机器学习模型能够在不依赖物理过程知识的情况下,识别输入与输出之间的关系,并高效解决高维数据中的复杂非线性问题。例如,随机森林回归已被用于估算湖泊中的营养物质浓度,而人工神经网络、随机森林和极端梯度提升(XGB)则被用于预测水体质量。
贝叶斯网络(BN)作为一种基于图的模型,能够描述变量之间的全局和局部条件依赖关系,已被证明在解决复杂变量关系方面具有较高的有效性。然而,BN模型的结构通常依赖于专家经验进行主观设定,这在一定程度上限制了其应用的准确性。为了解决这一问题,结构方程模型(SEM)被引入,通过构建因果关系网络来评估变量之间的直接和间接影响,使得其在复杂环境系统中具有更高的适用性。SEM能够为BN模型的构建和验证提供可靠的理论基础,从而提升模型的解释力和预测能力。
然而,SEM指导的BN模型虽然能够捕捉复杂的变量关系,但其内在假设为线性关系,这可能无法充分反映水生态系统中非线性的生物地球化学过程。为了解决这一局限性,研究团队提出了一种结合BN与非线性机器学习算法的模型集成技术,以更好地捕捉水质参数与影响因素之间的非线性关系。这种集成方法能够提升模型的整体预测性能,使得对复杂水环境的模拟更加精确。
基于上述研究背景,本研究提出了一种混合方法框架,以系统描述降雨依赖性的水体参数相互作用与土地利用对水质的影响。研究的主要目标包括:(1)通过多统计分析和SEM识别影响水质的关键因素和模型结构;(2)构建并优化BN-XGB集成模型,以评估不同降雨模式下自然与人为因素对水质的影响;(3)预测不同土地利用情景下的水质等级,并提出最优的湖泊管理策略。研究结果将揭示不同降雨模式如何改变影响因素对水质的作用机制,从而为水生态系统的改善提供针对性的污染控制策略。
洪泽湖作为本研究的案例,位于中国东部,是长江与淮河流域交汇的重要水体,同时也是南水北调东线工程的关键水通道。该湖面积达2069平方公里,最大深度为4.5米,平均深度为1.9米,主要接收来自濉河、淮洪新河和新汴河的径流。研究团队从江苏省生态环境厅获取了2021年1月至2022年12月期间六个监测站的每日水质数据,包括水温(WT)、pH值、溶解氧(DO)、化学需氧量(COD)、氨氮(AN)、总氮(TN)、总磷(TP)、叶绿素-a(Chla)和藻类密度等九项参数。同时,研究还获取了高分辨率的降雨数据,用于分析降雨对水质的影响。
研究团队发现,水体参数在不同监测站之间表现出显著的空间差异。水温(WT)变化较小,大部分监测站的中位数接近20°C,而最北端的监测站(S2)记录的水温最低。pH值在各监测站之间保持相对一致,但S1和S5的pH值波动较大,这可能与化学反应和水生生物呼吸的差异有关。溶解氧(DO)浓度在各监测站之间基本保持稳定,但在某些特殊条件下可能会出现显著波动。例如,在干旱期间,DO浓度较高,而在降雨量增加后,DO浓度可能因污染物的释放而下降。
研究还发现,降雨模式对污染物的迁移和转化具有重要影响。短期降雨(3天内)可能导致污染物的快速释放,而中期降雨(7至15天)则可能通过稀释作用改善水质。然而,长期干旱后,土壤中的污染物可能在降雨初期被集中冲刷,形成所谓的“第一冲刷”现象,从而导致水体中污染物浓度的显著上升。这种现象在城市地区尤为明显,因为长期干旱期间污染物可能在地表累积,而在降雨初期被迅速冲刷进入水体。
此外,研究团队还发现,不同土地利用类型对水质的影响具有显著差异。例如,在农业和城市主导的情境下,氮和磷的输入量较高,可能导致水体中富营养化风险的增加。而在生态保护情境下,水质得到明显改善,并在平衡的情境下达到最佳状态。这表明,土地利用类型和降雨模式的相互作用对湖泊水质具有深远影响,需要综合考虑两者的动态变化。
本研究提出的方法框架不仅适用于洪泽湖,还具有广泛的应用前景。该方法可以为全球范围内面临相似水质问题的湖泊提供科学管理支持,尤其是在发展中国家和发达国家。通过结合BN与XGB模型,研究团队构建了一个能够捕捉复杂非线性关系的集成模型,使得对水质变化的预测更加准确。同时,通过SHAP技术,模型能够提供对各影响因素的解释,使得研究结果更具可操作性。
综上所述,本研究通过构建一种混合方法框架,系统分析了降雨依赖性的水体参数相互作用与土地利用对水质的影响。研究结果不仅揭示了不同降雨模式下污染物迁移和转化的特征,还提供了对土地利用类型和水质变化之间关系的深入理解。这些发现对于制定科学的湖泊管理策略,提高水质管理和生态可持续性具有重要意义。同时,本研究的方法框架为未来的研究提供了可复制的理论支持,有助于进一步探索复杂水环境的管理机制。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号