沙特阿拉伯(KSA)西部沿海地下水脆弱性集成评价:基于DRASTIC模型与机器学习算法

《Earth》:Integrated Assessment of Coastal Groundwater Vulnerability in Western Kingdom of Saudi Arabia Using the DRASTIC Model and Machine Learning Algorithms

【字体: 时间:2026年06月09日 来源:Earth 3.4

编辑推荐:

  摘要:沙特阿拉伯王国(KSA)的地下水资源对于满足人类社区、农业和工业需求具有重要意义。在沙特阿拉伯西部,海岸带含水层地下水是补充海水淡化水的关键资源。因此,确保地下水质量并防控污染已成为维护水安全的重要优先事项。本研究旨在评价Wadi Marawani盆地内

  
摘要:沙特阿拉伯王国(KSA)的地下水资源对于满足人类社区、农业和工业需求具有重要意义。在沙特阿拉伯西部,海岸带含水层地下水是补充海水淡化水的关键资源。因此,确保地下水质量并防控污染已成为维护水安全的重要优先事项。本研究旨在评价Wadi Marawani盆地内的地下水质量及其污染脆弱性。为实现该目标,研究人员综合运用了水质指数(WQI)、DRASTIC模型、机器学习(ML)算法以及地理信息系统(GIS)。评估基于64个水样的水化学分析结果。此外,研究人员利用DRASTIC模型对若干输入参数进行评价,以估算DRASTIC指数(DI)并生成地下水脆弱性图。研究人员采用了三种ML算法,即多层感知机(MLP)、随机森林(RF)和决策树(DT),用于预测水质指数如总溶解性固体(TDS)、钠吸附比(SAR)以及DRASTIC指数(DI)。结果表明,约36%的水样被划分为淡水(TDS<1000 mg/L)。MLP?Vul.模型在训练阶段达到了R2=1.00、RMSE=0.01,RF?Vul.模型取得了R2=0.94、RMSE=3.17,DT?Vul.模型获得了R2=0.92、RMSE=3.57。虽然在测试阶段所有模型的RMSE均略有增加,但其预测性能仍然明确。
研究背景与问题提出:在全球水资源日趋紧缺、干旱与半干旱区对地下水依赖增强的背景下,沙特阿拉伯(KSA)西部海岸带含水层作为补充海水淡化水的重要水源,其水质退化和污染脆弱性问题日益突出。既有研究多单独开展地下水水质评价或脆弱性区划,传统DRASTIC模型存在权重与评分主观性强、对非线性过程刻画不足等局限,而常规实验室水质分析成本高、耗时长。因此,需要集成指数模型、GIS空间分析与机器学习(ML)方法,对海岸带含水层进行地下水质量与污染脆弱性的协同评价与高效预测。
研究人员以沙特阿拉伯西部Rabigh市东南的Wadi Marawani盆地为研究区,该区为典型干旱气候,海岸带第四系(Quaternary)未承压含水层由冲积砂、砾石、粉砂组成,受过度开采与海水入侵威胁。研究人员采集64个地下水样点水质与水位数据,结合水文地质参数,运用水质指数(WQI,含总溶解固体TDS、钠吸附比SAR等)、DRASTIC模型(七参数:地下水埋深D、净补给R、含水层介质A、土壤介质S、地形坡度T、包气带影响I、水力传导系数C)生成脆弱性指数(DI)与空间分布图;并构建三种ML算法——多层感知机(MLP)、随机森林(RF)、决策树(DT)——以物理化学与水文地质参数为输入,预测TDS、SAR和DI。论文发表于《Earth》。
主要关键技术方法:研究人员在Wadi Marawani盆地布设64个地下水采样点(样本队列来源:64个海岸带含水层地下水样点),测定水化学离子(K+、Na+、Ca2+、Mg2+、Cl?、SO42?、HCO3?、NO3?等)与理化参数(pH、电导率EC、TDS等),通过电荷平衡误差控制数据质量;利用GIS(ArcGIS 10.5)进行DRASTIC七参数图层构建(IDW插值、重分类、加权叠加算DI)与空间分布制图;ML方面采用Python的scikit?learn库,数据预处理(缺失值与异常值处理、标准化)、按7:3划分训练?测试集、5折交叉验证结合网格搜索优化超参数,分别构建MLP(隐藏层1?5层、神经元2?10、激活函数ReLU/Tanh等)、RF(树数1?20、最大深度1?20、分裂准则MSE)、DT(最大深度1?20、分裂准则MSE)三类回归模型,以R2和RMSE评价性能。
研究结果:研究人员在以下部分得出相应结论。
4.1 海岸带含水层水文地质与质量评价:第四系未承压含水层是研究区主要地下水赋存层,地下水位流向自东向西至红海。TDS介于346~18171 mg/L(均值约2936.5 mg/L),约36%水样为淡水(TDS<1000 mg/L),集中分布于中东部;下游TDS升高主要受海水入侵、过度开采混合、污水渗漏和灌溉回水影响。NO3?为2.2~290.7 mg/L(均值53.99 mg/L),约72%样品具中?高NO3?污染风险,源于农业化肥、生活污水与工业废水。SAR为1.10~32.50(均值6.60),大部分水样适于灌溉。离子比值(Na+/Cl?、Cl?/HCO3?、Ca2+/Mg2+)与HFE图表明约76%样品处于淡化相、24%处于咸化相(海水混合),证实研究区存在海水入侵。
4.2 地下水脆弱性评价:基于DRASTIC模型七参数图层加权叠加,DI介于87~139(均值约118.2),划分为低、中、高脆弱性三级。约78%面积为低?中脆弱性(西下游、东、中部),22%为高脆弱性(南、北部)。高脆弱区与高NO3?区部分吻合,反映农业施肥等面源污染在浅埋深、高渗透性砂?砾沉积区更易下渗;DRASTIC模型虽具主观赋权局限,但仍可有效识别脆弱区以指导防控。
4.3 ML对WQI与DI的预测性能:MLP?TDS(单隐层9神经元、ReLU、500次迭代)训练R2=1.00、RMSE=25.29,测试R2=1.00、RMSE=61.02,优于RF?TDS(测试R2=0.98、RMSE=360.70)和DT?TDS(测试R2=0.97、RMSE=400.95)。MLP?SAR(单隐层7神经元、Tanh、700次迭代)训练R2=1.00、RMSE=0.02,测试R2=0.90、RMSE=1.08,优于RF?SAR(测试R2=0.64、RMSE=2.03)和DT?SAR(测试R2=0.61、RMSE=2.11)。MLP?Vul.(两隐层各4神经元、500次迭代)训练R2=1.00、RMSE<0.01,测试R2=1.00、RMSE<0.01;RF?Vul.测试R2=0.94、RMSE=3.17;DT?Vul.测试R2=0.92、RMSE=3.57。学习曲线显示三类模型均未过拟合,MLP整体预测精度最高。
讨论部分总结:研究人员指出DRASTIC模型可有效识别脆弱区但受主观权重影响;ML模型(尤其MLP)能以高精度预测TDS、SAR和DI,部分近完美R2源于目标变量与输入间的确定性公式关系(DI为加权线性和、TDS为离子和、SAR为确定算式),该设计是有意的概念验证,用以量化参数相对重要性并实现模型简化。研究表明可从14项理化参数缩减为5项(Ca、Mg、Na、SO4、Cl)预测TDS和SAR(减少约64%),DI可从7项减为3项(地下水埋深D、地形坡度T、水力传导系数C),从而在保证精度的前提下降低监测成本与计算量。ML提供快速、低成本替代传统复杂计算的可能。结论部分译文:地下水污染风险全球趋增,传统空间方法受固定权重限制。本研究集成ML(MLP、RF、DT)与DRASTIC、GIS,证明ML能自适应调整系数并纳入站点特定变量以评价水质与脆弱性。DI图与NO3?分布对照显示高硝酸区多对应高DI区。ML预测WQI与DI的R2常超0.95,可用较少参数快速评估水质、降低监测成本与时间。为避免水质恶化与高脆弱性,建议调控农业开发、推广先进灌溉、减少氮肥使用、监管市政与工业废水。模型虽针对Wadi Marawani校准,但方法框架可迁移;未来将在其他流域验证并建更广区域模型。成果可为区域规划者提供主动防控策略以支持决策。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号