《Journal of Cleaner Production》:Advancing reservoir water quality management by a depth-specific approach integrating Bayesian optimization and machine learning algorithms
编辑推荐:
深度特异性水质管理方法在阿曼Wadi Dayqah水库的应用研究,通过表面水质数据与地理坐标结合,利用贝叶斯优化和四种机器学习模型(回归树、支持向量回归、高斯过程回归、集成树)实现20米和25米深度溶解氧(DO)和叶绿素a(Chl-a)的精准反演。高斯过程回归模型在20米深度DO预测中R2达0.88,Chl-a预测R2达0.95,填补了传统深度采样成本高昂的技术空白。
穆罕默德·雷扎·扎吉扬(Mohammad Reza Zaghiyan)| 穆罕默德·雷扎·尼库(Mohammad Reza Nikoo)| 加齐·阿尔-拉瓦斯(Ghazi Al-Rawas)| 陈明杰(Mingjie Chen)| 鲁兹贝赫·纳扎里(Rouzbeh Nazari)| 马利克·阿尔-瓦迪(Malik Al-Wardy)| 阿米尔·H·甘多米(Amir H. Gandomi)
伊朗德黑兰塔比阿特莫达雷斯大学(Tarbiat Modares University)水利工程与管理系
摘要
本文开发并评估了一种创新的、针对特定深度的水质管理方法,该方法应用于阿曼最大且最具战略意义的大坝。与依赖昂贵深水采样的传统模型不同,本研究提出了一种新颖的从水面到水下的推断框架。我们利用水质变量(WQVs)的表面测量数据以及地理坐标(纬度和经度),来估算水库内两个与进水口相关的深度处的溶解氧(DO)和叶绿素-a(Chl-a)浓度。该方法结合了贝叶斯优化技术和四种机器学习(ML)算法:回归树(RT)、支持向量回归(SVR)、高斯过程回归(GPR)和集成树(ET)。在瓦迪代卡(Wadi Dayqah)水库的二十个采样点对水质变量进行了全面监测,采样深度最大为35米。在20米和25米这两个深度(即进水管道的安装位置),通过逐步回归分析确定了影响DO和Chl-a的主要因素。通过减少输入变量的数量,GPR模型在估算这两个深度的Chl-a和DO时表现更为出色。在20米深度,GPR模型的R平方值为0.88,均方根误差(RMSE)为0.105,平均绝对误差(MAE)为0.070;在25米深度,其R平方值为0.95,RMSE为0.059,显示出最高的准确性。本研究是一个单水库的概念验证案例,要将该方法推广到具有不同形态特征的水体,还需要进一步验证。在解决水库水质问题方面,本研究的结果可能为实施水质管理策略和干预措施提供新的视角。
引言
水库中的水质对于维持生态完整性、支持社会经济活动以及确保下游供水系统的可靠性起着关键作用(Ziemińska-Stolarska和Kempa,2021)。大坝的建设和运行通过改变沉积物输送、养分循环、氧气动态和热分层模式,从根本上改变了河流系统。这些变化通常会导致水质在空间和垂直方向上的显著异质性,从而影响水生生态系统、饮用水处理和下游环境健康(Semensatto等人,2021;Zaghiyan和Ketabchi,2022)。因此,由于物理、化学和生物过程之间的非线性相互作用以及它们对水动力和热力学条件的敏感性,监测和预测水库中的水质变量(WQVs)仍然是一项复杂的任务(Noori等人,2021)。
传统上,准确评估水库水质依赖于使用专业仪器和训练有素的人员进行现场采样和数据分析,这通常需要多次现场访问和大量的后勤工作(Gobeze等人,2023)。这些方法成本高昂、耗时且受空间限制,尤其是在需要多深度长期监测的情况下(Ma等人,2020)。在分层明显的水库中,这一问题更加突出,因为水面条件可能无法准确反映深层的水质,尤其是在直接影响下游水质和处理过程的进水口附近(D?bska等人,2021)。
已有多种方法用于评估水库水质,包括基于过程的模拟模型(Kim等人,2023;Noori等人,2021;Shen等人,2023;Zhao等人,2021)、统计技术(Avila等人,2018;Buta等人,2023;Kumar等人,2021;Noori等人,2018)、机器学习(ML)模型(Ha等人,2020;Lee等人,2022;Mamun等人,2019;Wang等人,2023;Ziyad Sami等人,2022)、遥感方法(Avdan等人,2019;Bonansea等人,2019;Ouma等人,2020;Song等人,2022)以及与物联网(IoT)技术集成的实时监测系统(Adeleke等人,2023;Han等人,2023;Pasika和Gandla,2020;Rose等人,2021)。尽管这些方法在表面水质监测和预测方面取得了进展,但它们在深度分辨水质评估中的应用仍然有限。最近的研究表明,利用集成学习、深度学习和时空特征提取技术,先进的ML框架在多个水库深度上估算水质具有潜力(Majnooni等人,2024)。其他研究还结合了不确定性感知建模和决策支持框架(包括基于copula的方法和数据包络分析)来提高水质评估的可靠性(Zare等人,2025)。混合技术和基于聚类的方法通过整合空间分析和不确定性量化进一步增强了预测的稳健性(Fooladi等人,2024)。尽管取得了这些进展,大多数现有方法仍依赖于特定深度的观测数据或历史深水数据集,这限制了它们在连续深度监测不可行的实际应用场景中的可扩展性和适用性。虽然ML已广泛应用于水库管理,从营养状态建模(Li等人,2023)到水质指数预测(Uddin等人,2023),但大多数模型仍然依赖于表层观测数据或先前收集的深水测量数据。在分层明显的水库中,这一限制尤为突出,因为深层水质可能独立于表层条件恶化。尽管物联网支持的传感和实时深度学习模型的最新进展显著提高了地表水质监测能力(Chellaiah等人,2024;Arepalli和Jairam Naik,2024;Song等人,2026),但使用易获取的地表数据对深层分层和深层动态进行建模仍是一个关键的研究空白。观测研究为了解水库水质的深度依赖性变化提供了宝贵见解(Ling等人,2017,2019;Wardhani和Sugiarti,2021)。然而,这些努力主要集中在描述观测到的变化上,而不是开发能够利用地表测量数据推断深层水质的预测框架。因此,仍需要成本效益高、可扩展的建模方法,能够在不依赖连续深水监测的情况下估算关键操作深度的水质。为了解决这一空白,本研究提出了一种新颖的深度特定推断框架,该方法利用地表水测量数据和地理坐标来估算进水口相关深度的水质变量。所提出的方法结合了机器学习和贝叶斯优化来推断深层水质,无需常规的垂直分层测量。与依赖历史深水记录的先前研究不同,该空间推断模型利用地表指标作为地下动态的代理,使得在监测基础设施有限的水库中能够实际应用。该方法包括:(1)使用CTD(AAQ-RINKO)测量数据根据最大深度对采样点进行聚类,以定义代表性区域;(2)分析垂直剖面以表征深度依赖的变异性;(3)通过特征选择确定关键预测因子;(4)使用贝叶斯优化开发优化后的ML模型;(5)在全预测因子和减少预测因子的情况下评估模型性能。
通过利用地表观测数据可靠地估算进水口处的水质,本研究推动了水库系统的运行监测和管理。所提出的框架为水质处理和选择性取水策略提供了决策支持,并为实时评估水库水质提供了可扩展的解决方案。实验设计、方法论框架和结果将在后续部分中详细介绍。
方法论
本研究采用ML算法,因为它们能够模拟位于水库表面和地下不同深度的水质变量之间的复杂非线性相关性。为了降低过拟合风险并提高模型的韧性,采用了额外的优化策略。本文的后续部分详细介绍了研究中使用的方法论,包括数据收集、深度和聚类选择等任务。
研究区域
阿曼是一个半干旱国家,永久性地表水资源有限。瓦迪代卡(Wadi Dayqah)是少数几个例外之一,它是一条流量稳定在约1.5立方米/秒的独特河床。瓦迪代卡大坝项目始于2009年8月,是阿曼最高的混凝土重力坝,高度为75米。大坝覆盖了超过1700平方公里的集水区,年平均降水量为150毫米。然而,强烈的气旋仍可能导致突发洪水(Prisk等人)
关键估算因子的确定
如第2-2节所述,选择20米和25米这两个深度进行水质估算。这些深度靠近大坝的进水口,特别是主进水口(海拔137米),能够精确评估水质。这些深度的热分层现象为了解水库低层的水质状况提供了重要信息。在本研究中,应用逐步回归分析确定了水库表面水体的关键水质变量
结论
本研究的主要目标是缓解由于热分层和长时间储水导致的水库水质问题。先前研究在应用ML进行水库水质管理时发现了具体局限性,尤其是在不同深度的水质波动方面。本研究提出了一种新方法,用于估算与进水口安装位置对应的深度处的溶解氧(DO)和叶绿素-a(Chl-a)浓度
局限性
需要注意的是,采样期间未涵盖秋季。然而,鉴于阿曼干旱的气候特征(夏季漫长且冬季短暂),该研究捕捉到了最关键的水文阶段:冬季混合和夏季的热分层峰值。虽然缺少过渡期的数据,但模型是在最坏情况下(缺氧事件)进行训练的,因此在风险管理方面具有潜力。更广泛地说,所提出的方法论具有通用性
CRediT作者贡献声明
穆罕默德·雷扎·扎吉扬(Mohammad Reza Zaghiyan):撰写——原始草稿、可视化、验证、软件开发、调查、正式分析、数据整理。穆罕默德·雷扎·尼库(Mohammad Reza Nikoo):撰写——审阅与编辑、验证、监督、资源管理、项目协调、方法论制定、资金获取、数据整理、概念构思。加齐·阿尔-拉瓦斯(Ghazi Al-Rawas):撰写——审阅与编辑、验证、资源协调。陈明杰(Mingjie Chen):撰写——审阅与编辑、可视化、验证。鲁兹贝赫·纳扎里(Rouzbeh Nazari):撰写——审阅与编辑
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
作者感谢苏丹卡布斯大学(Sultan Qaboos University)在SR/ENG/CAED/22/01号资助项目下的财务支持。