基于二维蒙特卡洛仿真的水质指数模型的多源不确定性量化
《Environmental Modelling & Software》:Multi-source uncertainty quantification of water quality index models based on two-dimensional Monte Carlo Simulation
【字体:
大
中
小
】
时间:2026年01月07日
来源:Environmental Modelling & Software 4.6
编辑推荐:
传统水质量指数(WQI)模型存在权重主观性及输入不确定性分析不足的问题。本研究构建机器学习与二维蒙特卡洛模拟融合框架,通过随机森林、XGBoost等算法评估参数重要性并优化权重,结合汉江流域实测数据,系统分析参数波动、评分函数变化及权重分配的三重不确定性,揭示协同效应风险。结果表明优化模型具有更强的环境适应性。
Xizhi Nong|Jiaojiao Tian|Lihua Chen|Jiahua Wei
广西大学土木工程学院,中国南宁530004
摘要:
本研究探讨了传统水质指数(WQI)模型在权重确定方面的主观性及其对输入不确定性的有限考虑。本文提出了一种结合机器学习方法和二维蒙特卡洛模拟(2D MCS)的框架,用于水质不确定性分析,并以中国汉江流域的稳健性监测数据作为案例研究。使用随机森林(RF)、XGBoost、递归特征消除(RFE)和支持向量机(SVM)等算法来评估参数重要性、选择关键指标并为改进后的WQI模型分配权重。评估了四种不确定性情景,并通过双层蒙特卡洛模拟检验了模型的稳定性。结果表明,优化后的WQI模型更加稳健和适应性强,尤其是在多重不确定性共同作用的情况下,这突显了协同效应的风险。
引言
“水质指数(WQI)是否已经过时?”这一在水利环境科学中日益引起争议的问题,揭示了当代水质评估中的一个深刻矛盾。作为重要的综合环境评估工具,WQI模型被广泛用于全球的地表水质量监测和管理(Nong等人,2020年)。该模型的优点在于其简单性和直观性,它将多个水质参数转换为无量纲分数,并根据某种权重机制进行整合,从而反映了水体的整体环境质量。然而,尽管许多学者认为信息的整合和简化提高了评估效率,但在构建和评估过程中仍存在许多不确定性来源,这些不确定性显著影响了模型输出的准确性和可靠性,导致结果较差、不可靠且不够精确(Radwan和Willems,2007年)。
水质参数本身具有显著的自然变异性,这种变异性受到时间、空间、水文气象条件等因素的影响,导致同一地区在不同监测时期的WQI结果出现较大波动(Caldwell等人,2019年;Le等人,2019年)。WQI模型中的评分函数通常基于经验或专家判断设定,这具有高度的主观性,其形式和参数设置的选择可能会引入认知不确定性。不同研究中指标权重的确定方法差异很大,包括等权重、熵权重、主观权重以及各种方法的组合等,不同的权重设置会显著影响最终评估结果(Jyrkama和Pandey,2016年;Penney,2017年)。WQI模型内部的不确定性传播表现出明显的协同和层次耦合特性。水质参数、权重分配和聚合函数共同构成了一个从输入到输出的动态不确定性链(Uddin等人,2021a)。仅限于单个组件的不确定性分析只能揭示局部特征,而联合扰动分析(例如涉及参数、标准化和权重的联合扰动)则能更全面地反映系统不确定性传播的真正机制。因此,后续研究需要进一步量化这些协同效应,以阐明WQI模型在复杂水环境条件下的不确定性形成机制和稳定性特征。因此,如何系统地识别和量化这些不确定性来源对WQI输出的综合作用,已成为当前水质评估研究的关键问题。为了克服这些限制并弥合方法论上的差距,风险分析理论和计算机建模的最新进展提供了一种有效的方法。
尽管在WQI模型不确定性分析方面已经取得了一些初步进展,但大多数现有研究仅关注单一的不确定性来源(例如参数扰动或权重变化),并使用一维蒙特卡洛模拟进行敏感性分析(Ali等人,2012年)。虽然这种方法可以反映模型对输入扰动的响应,但在面对多重不确定性来源时存在明显局限性:它无法有效区分自然变异性和参数认知不确定性的贡献,且难以为输出结果提供置信区间和变化范围。近年来,随着风险分析理论的发展和计算能力的提高,二维蒙特卡洛模拟(2DMCS)已被引入环境建模领域,为水质建模提供了更全面的框架(Aldoury和Hammood,2024年;Fonseca等人,2024年;Roy等人,2024年;Zhao等人,2024年)。2DMCS通过双层嵌套循环模拟自然变异性(例如水质参数的空间和时间波动)和认知不确定性(例如评分函数的形式和权重的分布),能够捕捉模型输出的变化范围和置信区间。这种方法已成功应用于饮用水健康风险评估、地下水污染传输建模和整个流域控制等领域,显著提高了环境决策的科学性和稳健性(El Bilali等人,2022年;Liu等人,2026年;Malekhosseini等人,2023年;Yazdi等人,2022年)。然而,2D MCS尚未在WQI建模中得到系统应用,相关案例仍然较少,特别是缺乏对不同WQI结构模型在多重不确定性下的响应特性的深入比较和评估(Romano等人,2021年;Setshedi等人,2021年;Uddin等人,2021b)。
鉴于传统WQI模型的局限性及其在复杂不确定情景下的适应性不足,本研究将机器学习与多层次框架相结合,用于不确定性量化。考虑到WQI模型的上述不确定性研究空白,本研究提出了一种“机器学习+不确定性量化”的综合方法框架,包括三个主要步骤:智能加权、不确定性反卷积和模型特定优化,基于二维蒙特卡洛模拟。通过配备一个基于机器学习的“认知引擎”和不确定性驱动的“风险雷达”,使传统的WQI模型演变为一个多功能工具:既适合政策制定者的简洁仪表板,也适合科学家的精确工具,重新打造了一个简化但非简化的水质评估工具。我们的框架表明,传统的WQI并非过时的“遗迹”,而是一个等待转型的“沉睡巨人”。研究结果将为WQI模型的优化提供科学依据,并为未来的区域尺度水质评估提供高置信度的技术支持。
方法论和模型
本研究提出了一种基于二维蒙特卡洛模拟框架(Deng等人,2012年;Logez等人,2019年)分析WQI模型不确定性的方法。该方法在模拟过程中引入了三种类型的不确定性扰动:输入水质参数的变化、评分函数的结构扰动和指标权重的随机波动,并通过外层循环控制认知不确定性的采样,同时模拟自然变异性。
案例研究
汉江是长江中游最大的支流,主干流长度为1577公里。其流域跨越陕西、河南和湖北三个省份,面积约为159,000平方公里(Nong等人,2023年)。该地区具有亚热带季风气候,年平均降水量在700至1,300毫米之间,年总径流量约为550亿立方米,约占长江总径流量的5%。
模型响应性能
比较了六种WQI模型在不同不确定性情景下的输出平均值。图5显示了在四种不确定性情景下,六种WQI模型模拟得到的输出平均值,图5中的折线图展示了每种模型在仅参数扰动(P)、仅评分函数扰动(SI)、仅权重扰动(W)以及三者联合扰动(W_P_SI)情景下的平均WQI值趋势。
可以看出
模型对不确定性的响应
就模型平均响应而言,评分函数的不确定性显著降低了大多数模型的输出平均值(具有“压缩”效应),而权重不确定性对平均值的影晌因模型而异,有些模型甚至表现出更高的平均值趋势(例如,在权重扰动下,加权模型可能倾向于给出更好的水质评估)。这一发现表明,WQI评估结果可能存在
结论
本研究通过二维蒙特卡洛模拟系统地评估了多种不确定性来源对不同WQI模型的影响,所得结果具有重要的理论和实际意义。基于双层嵌套蒙特卡洛模拟,通过将参数波动、评分函数扰动和权重扰动引入WQI计算的内层和外层循环,并设计相应的扰动
CRediT作者贡献声明
Xizhi Nong:撰写——原始草稿、可视化、软件、资源、方法论、资金获取、数据整理、概念化。Jiaojiao Tian:撰写——原始草稿、软件。Lihua Chen:撰写——审稿与编辑、监督、资源。Jiahua Wei:撰写——审稿与编辑、监督
数据可用性
资金支持
本研究得到了国家自然科学基金(编号:52309016)和广西青年科学基金(编号:2023GXNSFBA026296)的资助。
利益冲突声明
? 作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
致谢
作者感谢编辑和审稿人的宝贵建议和贡献,这些贡献显著提升了本文的质量。本研究得到了国家自然科学基金(编号:52309016)和广西青年科学基金(编号:2023GXNSFBA026296)的资助。
Dr. Xizhi Nong:副教授;中共中央组织部授予的西部杰出青年人才;广西大学土木工程学院,中国南宁530004;清华大学水利科学与工程国家重点实验室,中国北京100084
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号