分析半封闭海湾中污染物传输的主要驱动因素:基于数值模型和可解释机器学习的见解

《Journal of Environmental Management》:Analyzing the key drivers of pollutant transport in semi-enclosed bays: Insights based on numerical model and interpretable machine learning

【字体: 时间:2026年01月05日 来源:Journal of Environmental Management 8.4

编辑推荐:

  污染在半封闭海湾中的迁移特性及驱动机制研究。基于EFDC模型模拟污染物水平迁移,结合XGBoost+SHAP模型解析潮汐作用、河流入流与风力驱动交互影响。研究表明,内湾区短期潮汐波动主导迁移,洪潮促进污染物累积,春汛增强外泄;口外区河流入流贡献率高达56.1%,风力在低水位期加剧潮汐作用,导致污染物回流内湾。成果为半封闭海湾精细化排污管理提供科学依据。

  
陈晓王|雷华|艾菊友|向莉|辛文莉|赖宇金|洪哲潘|闫雅宁|闫海斌|李一平
浙江水利与河口研究所(浙江海洋规划与设计研究院),杭州,310020,中国

摘要

由于地形受限且水体交换有限,半封闭海湾中的污染物传输是一个复杂的过程,受潮汐作用、上游河流流量和风力的共同影响。传统的数值模型和机器学习模型难以有效分析此类环境中污染物传输的关键驱动因素。本研究采用数值模型(Environmental Fluid Dynamics Code,EFDC)揭示了半封闭海湾中污染物的传输特性,并采用可解释的机器学习方法(XGBoost + SHAP模型)来分析污染物水平物理传输的潜在关键环境驱动因素及其相互作用。以中国三门湾为例,研究结果表明:短期潮汐波动主要控制着内湾区域的污染物传输;洪潮会促进污染物在海湾内的积累;而长期春潮则有助于污染物向外传输;上游河流流量在海湾口区域起主导作用,其贡献值最高可达56.1%。开放海湾口的污染物会随着上游河流流量向开阔海域传输;风力会增强潮汐对污染物传输的影响,尤其是在水位较低时,水体更容易受到风力作用。这些发现为半封闭海湾的污染控制提供了科学依据。

引言

海湾以其独特的地理环境、优越的条件和丰富的资源而成为全球最早被开发的海洋区域之一。海湾根据开放程度指数(海湾宽度/海岸线长度)进行分类:>0.2(开放型)、0.1–0.2(半开放型)、0.01–0.1(半封闭型)和<0.01(封闭型)(周,2020)。每种类型都具有不同的水动力和地貌特征。半封闭海湾通常具有狭窄的入口和广阔的水域以及复杂的海岸线(刘等人,2021)。海岸线作为物理屏障可以抑制波浪能量(黄和李,2023),使其成为多种沿海产业的理想选择。然而,其受限的地貌和有限的水体交换能力导致自净能力较弱,水质波动明显(吴等人,2019;子等人,2025)。外部因素如河流流量、水产养殖和家庭废水排放会持续在海湾中积累污染物,对人类健康构成严重威胁(阿坦加纳·恩乔克等人,2023;何等人,2025;萨拉萨尔-加梅斯等人,2025;魏等人,2025)。因此需要采取有效的管理策略。
现有研究表明,污染控制正从末端处理转向源头控制,精细化的排放管理已被证明是有效的(薛等人,2023;张等人,2017)。对于半封闭海湾,根据污染物传输规律调节排放时间可以显著减少海洋污染(刘等人,2024;帕帕斯利奥蒂等人,2024)。然而,来自海洋(潮汐作用)、陆地(上游河流流量)和大气(风力)的外部驱动因素与复杂的水深和流体力学相互作用,共同控制着污染物的命运(卡塞雷斯-尤塞等人,2023;苏西普托等人,2025;魏等人,2025;张等人,2021)。例如,魏等人(2025)发现,由于流入海洋的河流流量减少,冬季海湾内的污染物浓度相对较高。王等人(2025)表明,不同的风向会影响污染物的移动距离和方向,与河流流向相同的风会加速污染物的传输。即使在相似的环境条件下,半封闭海湾不同区域的污染物传输规律也存在空间差异(肖等人,2023;吴等人,2021)。然而,以往的研究主要关注单个驱动因素(潮汐、流量、风场)对污染物传输的影响(魏等人,2025;徐和楚,2016;赵等人,2025)。污染物传输需要综合考虑各种驱动因素的影响。很少有研究量化了各种驱动因素对水体中污染物传输的贡献,并全面考虑了它们之间的协同或拮抗作用。因此,有必要进一步研究在不同环境条件下(潮汐作用、上游河流流量、风力)半封闭海湾中污染物传输的关键驱动因素及其相互作用。阐明这些机制对于半封闭海湾的科学化排放管理至关重要。
传统上,有两种主要方法用于模拟水体中的污染物传输。第一种是水环境数值模型,该方法利用数值方程定量描述污染物传输过程,能够准确再现其时空分布和迁移特征(阿纳戈斯托乌等人,2017),已被广泛应用并取得了满意的效果(陈等人,2016;沃尔德曼等人,2017;叶姆等人,2020)。第二种是机器学习模型,作为一种数据驱动的方法,机器学习模型建立预测因子与响应之间的统计映射以预测目标值(古普塔等人,2021)。它需要较少的先验知识,数据类型少,但具有强大的预测能力(姜等人,2024;张和吴,2024)。例如,苏等人(2025)开发了一种用于潮汐预测的深度学习方法,能够准确预测内部潮汐。这两种方法都已应用于半封闭海湾(张等人,2013;纪等人,2024)。然而,半封闭海湾复杂的水动力和地形挑战了独立模型有效捕捉非线性相互作用和驱动因素贡献的能力(阿德尔等人,2024;米赫尔等人,2024)。传统数值模型通常通过设置不同情景来控制单一环境因素(如潮汐和河流流量)对目标变量(如污染物传输)的影响。然而,当需要量化多个驱动因素之间的复杂相互作用时,这种方法需要构建大量组合情景(郑等人,2010;徐等人,2022),这一过程相当繁琐和复杂。同时,传统机器学习模型具有强大的预测能力,但本质上是“黑箱”。它们可以建立统计映射关系,但缺乏揭示输入和输出之间潜在物理因果关系的机制,这阻碍了主导因素的识别(坎布里亚等人,2023;刘等人,2025)。它们还需要大型数据集,而这些数据集的获取往往成本高昂(朴等人,2021)。因此,单独使用这两种方法都无法可靠地识别半封闭海湾中污染物传输的关键驱动因素。
可解释的机器学习(IML)是解决这一问题的方法之一。IML通过关注事后模型解释来提供可行的解决方案,揭示输入-输出关系,并满足阐明潜在机制的需求(Park等人,2022)。事后解释是一种事后方法,可以在不牺牲模型预测性能的情况下提供对潜在机制的洞察(刘等人,2025)。这种方法计算效率高,在环境研究中应用日益广泛(王等人,2024;吴等人,2025)。本研究采用了数值模型(EFDC)和可解释的机器学习模型(XGBoost + SHAP)的混合建模框架,克服了单一模型在分析污染物传输方面的局限性。首先,EFDC模型的拉格朗日示踪粒子模块可以有效模拟半封闭海湾中污染物的水平物理传输过程(Shahidzadehasadi等人,2024)。随后,EFDC模型的模拟结果被用作XGBoost模型的训练数据,从而解决了获取大量机器学习模型训练所需数据的问题。这种方法在以往的研究中也得到了广泛应用。数值模型可以通过设置适当的边界条件生成大规模数据集,而机器学习模型可以基于此提供高效准确的模拟和预测性能(陈等人,2025;董等人,2025)。最后,通过SHAP分析,XGBoost模型捕捉到的复杂非线性关系被转化为可解释的驱动因素贡献,从而探讨了EFDC模型中模拟污染物传输的关键指标。基于此,揭示了半封闭海湾中污染物传输的各种驱动因素的贡献和相互作用。
本研究以中国浙江东部的三门湾为例。首先,我们使用环境流体动力学模型(EFDC)构建了该区域的三维水动力模型。随后,我们利用EFDC模型的拉格朗日示踪粒子模块模拟了不同环境条件下不同位置的污染物水平物理传输。最后,我们应用了极端梯度提升模型(XGBoost)结合Shapley Additions exPlanations(SHAP)来探讨各种环境参数对EFDC模型模拟中污染物传输的影响。基于此,揭示了不同水期间半封闭海湾不同位置污染物水平物理传输的潜在关键环境驱动因素,并分析了驱动因素之间的相互作用。本研究旨在回答以下问题:(1)半封闭海湾中污染物的传输特性是什么?(2)不同水期间半封闭海湾不同位置的污染物传输的潜在关键环境驱动因素是什么?(3)不同驱动因素之间的相互作用如何影响半封闭海湾中的污染物传输?(4)如何半封闭海湾中的污染物排放?本研究的结果有望为半封闭海湾中的精细污染物管理提供科学依据。

研究区域

研究区域

三门湾位于中国东部海岸,是本研究的研究对象(图1a和b)。该地区属于北亚热带夏湿冬暖气候区,年平均降水量约为1400毫米。海湾南北延伸约55公里,东西延伸约50公里,海域面积约为540平方公里。有多条河流将大量水流注入海湾,如海友溪和白溪。海湾东南部开放,三面被陆地包围。

在不同潮位下

涨潮-退潮周期强烈调节了污染物的传输。图2、图3和图4展示了三个站点的单潮传输模式。在内部海湾(海友港)释放的颗粒响应最快,在涨潮和退潮的最初2小时内实现了最远的传输距离(图2a–b和d-e)。涨潮抑制了向海外的传输,而退潮则促进了传输。相比之下,在海湾口( Shipu港和Puba港)释放的颗粒对潮汐阶段的敏感性较低。

潮汐作用

本研究基于XGBoost + SHAP模型分析了EFDC模型中模拟污染物传输的关键环境指标,以识别不同水期间半封闭海湾中污染物水平物理传输的潜在关键环境驱动因素及其相互作用。研究结果表明,潮汐作用显著影响海湾中的污染物传输。

结论

本研究创新性地结合了三维水动力模型(EFDC)和可解释的机器学习模型(XGBoost + SHAP),研究了不同水期间潮汐作用、上游河流流量和风力对半封闭海湾周围污染物水平物理传输的影响。基于研究结果,提出了若干关于半封闭海湾污染物排放的建议,为精细化的排放管理提供了支持。

作者贡献声明

陈晓王:撰写——原始草稿、可视化、方法论、数据整理。雷华:撰写——审稿与编辑、软件使用、调查、资金获取。艾菊友:监督、项目管理、资金获取、概念化。向莉:验证、形式分析。辛文莉:验证、方法论。赖宇金:撰写——审稿与编辑、形式分析。洪哲潘:验证、形式分析。闫雅宁:方法论、形式分析。闫海斌:撰写——审稿

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了浙江省重点研发计划(2024C03234)、科学技术地方发展项目中央指导基金(2025ZY01091)、河湖水网健康修复浙江重点实验室(2025E10112)以及浙江水利与河口研究所(浙江海洋规划与设计研究院科学研究基金重点项目(ZIHE25Z002)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号