利用空间随机森林模型实现高分辨率区域尺度地下水位的精准预测

《International Journal of Applied Earth Observation and Geoinformation》:Predicting regional-scale groundwater levels at high spatial resolution using spatial Random Forest models

【字体: 时间:2025年10月28日 来源:International Journal of Applied Earth Observation and Geoinformation 8.6

编辑推荐:

  本研究针对地下水监测数据稀缺且不连续的难题,创新性地采用空间随机森林插值(RFSI)模型,整合邻近观测井数据作为空间协变量,成功生成了德国勃兰登堡地区2001-2022年月尺度1 km2高分辨率地下水位(GWL)估算图。结果表明,RFSI模型预测精度(R2=0.86,RMSE=3.77 m)显著优于传统RF、RFsp和SVM模型,有效改善了深井水位低估和浅井水位高估的问题,为区域水资源管理和气候变化适应策略提供了重要数据支撑。

  
水,是生命之源,更是农业的命脉。在全球气候变化加剧的今天,地下水作为重要的水资源,其动态变化直接影响着作物生长、生态系统平衡乃至区域经济的可持续发展。然而,一个严峻的现实摆在面前:对于大多数地区而言,地下水位(Groundwater Level, GWL)的监测数据往往因观测井分布稀疏、监测不连续而严重匮乏。这种数据缺口如同蒙在决策者眼前的迷雾,使得精准评估水资源状况、制定有效的水资源管理和气候变化适应策略变得异常困难。传统的物理模型虽然能够刻画地下水运动过程,但其构建需要海量数据支撑,且耗时耗力,难以满足大范围、高精度的预测需求。
面对这一挑战,机器学习(Machine Learning, ML)技术以其强大的数据挖掘和非线性关系拟合能力,为地下水位预测开辟了新途径。已有研究尝试将随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM)等ML模型应用于地下水领域,并取得了一定成效。但这些模型往往未能充分考虑地下水本身所具有的空间自相关性,即邻近区域的地下水位通常具有相似性这一关键特征。如何有效融入空间信息,提升模型在未监测区域的预测精度,成为当前研究的热点和难点。
在此背景下,由Ahsan Raza、Masahiro Ryo、Gohar Ghazaryan、Roland Baatz、Magdalena Main-Knorn、Leonardo Inforsato和Claas Nendel组成的研究团队,在《International Journal of Applied Earth Observation and Geoinformation》上发表了一项重要研究。他们探索了一种名为“空间随机森林插值”(Random Forest for Spatial Interpolation, RFSI)的新方法,旨在利用机器学习的力量,为德国勃兰登堡地区生成高空间分辨率(1 km2)的月度地下水位估算图,以揭示区域地下水的时空变化规律,为应对气候变化下的水资源挑战提供科学依据。
为了达成研究目标,研究人员系统性地整合了多源数据并采用了先进的分析方法。他们收集了勃兰登堡州环境局提供的2001年至2022年间1840个测压计的地下水头观测数据,并经过严格的质量控制筛选出可靠的数据集。同时,他们获取了包括地形属性(如坡度SLOPE、地形起伏度指数TRI、高程DEM、地形湿度指数TWI等)、水文参数(月尺度蒸散量ET)、气象参数(月尺度温度TEMP和降水PREC)以及植被参数(归一化植被指数NDVI和增强型植被指数EVI)在内的多种环境协变量,空间分辨率均为1 km。研究的关键技术创新在于对比了四种机器学习模型:传统随机森林(RF)、空间数据随机森林(RFsp)、空间插值随机森林(RFSI)以及支持向量机(SVM)。其中,RFSI模型的独特之处在于,它在建模时不仅使用了环境协变量,还引入了预测点附近最近几个观测井的实际水位值及其与预测点的距离作为额外的空间协变量,从而更有效地捕捉局部空间依赖关系。模型训练采用了一种针对空间数据的“留位置出”交叉验证策略,以确保评估结果的稳健性。模型性能通过决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)等指标进行评价。最终,利用表现最佳的模型生成了长期(2001-2022)月度地下水位的空间分布图,并进一步分析了其时空变化趋势。
3.1. 模型训练和精度评估
研究人员首先在训练数据集上评估了各模型的拟合效果。结果显示,RFSI模型对训练数据的拟合度最高,R2达到0.99,RMSE为0.77 m,表现出色。RF和RFsp模型也表现出较高的拟合度(R2分别为0.98和0.90),而SVM模型的拟合效果相对较差(R2较低,RMSE较高)。然而,训练集上的高拟合度并不能完全代表模型的预测能力,真正的考验在于对未参与训练的数据的预测精度。
3.2. 模型不确定性评估
3.2.1. RFSI与其他模型的比较
当模型应用于独立的测试数据集时,RFSI模型的优越性得到了充分体现。它在测试点上取得了最高的预测精度,R2为0.86,RMSE为3.77 m,显著优于RF(R2=0.75, RMSE=4.85 m)、RFsp(R2=0.72, RMSE=5.04 m)和SVM(R2=0.67, RMSE=5.59 m)。特别值得注意的是,对于水深不同的水井,模型表现存在差异。RF、RFsp和SVM模型普遍存在对深井(GWL >10 m)水位低估、对浅井(GWL 1–10 m)水位高估的现象。而RFSI模型则表现更好,其高估和低估的幅度均更小(浅井高估约1.1 m,深井低估约-3.9 m)。对残差分布的进一步分析表明,RFSI模型对于深浅水位的预测偏差都得到了更好的控制,说明其通过引入邻近观测值,有效缓解了因深水观测数据稀疏带来的预测挑战。
3.2.2. 特征相关性分析
通过分析各变量在模型中的重要性,研究人员发现,在不同模型中,主导因素有所不同。在RF模型中,地形位置指数(TPI)、高程(DEM)和地形湿度指数(TWI)等地形属性是最重要的预测因子。在RFsp模型中,除了地形因子,代表地理邻近效应的缓冲区距离变量也变得重要。而在RFSI模型中,来自最近观测井的水位值(如“obs1”、“obs2”)成为最重要的预测变量,这直接证明了引入局部空间信息对于提升地下水位预测精度的关键作用。同时,地形因子如TPI、DEM等仍然保持较高的重要性,表明环境背景信息和局部空间信息相辅相成。
3.3. 评估RFSI产生的高分辨率地下水位估算值
利用优化后的RFSI模型,研究人员生成了勃兰登堡地区2001-2022年月尺度、1 km2空间分辨率的连续地下水位图。结果显示,地下水位的空间分布与地形密切相关:高海拔地区地下水位通常较深,而随着海拔降低,特别是在河流沿岸和洼地,地下水位变浅,这反映了地表水与地下水之间的水力联系。生成的详细地图清晰地揭示了浅层地下水分布区域,这些区域也是潜在的洪涝风险和湿地生态系统所在。
3.4. 重建地下水位数据的时间剖面图和地图视图
研究还将RFSI模型应用于填补缺失观测数据的时间序列。模型成功重建了2016-2022年特定观测井的月度地下水位,模拟值与观测值之间显示出高度一致性(R2在0.68至0.75之间),表明模型能够准确捕捉地下水位的动态变化,包括年际和季节性波动。为了进一步验证模型在未监测区域预测的可靠性,研究人员将RFSI估算的地下水位变化与GRACE(重力恢复与气候实验)卫星反演的地下水储量异常(GWSA)数据进行了对比。尽管不同地点相关性存在差异,但总体上,RFSI估算的地下水位变化趋势与GRACE GWSA数据表现出正相关关系,特别是在区域平均尺度上,两者均显示出2002-2020年间地下水储量下降的趋势,这与该地区已有研究报道的干旱化趋势和地下水消耗状况相符。
3.5. 评估地下水位变化并识别热点区域
通过对长期地下水位数据进行季节性Mann-Kendall趋势检验,研究人员发现了明显的时空变化规律。在湿季,勃兰登堡大部分地区(占网格的45.35%)呈现出显著的地下水位下降趋势(下降速率介于-0.13 米/年至-0.88 米/年之间)。这种下降趋势在高海拔地区(通常大于50米)更为普遍,可能与这些地区降水补给相对较少、蒸散发消耗较大以及可能的农业用水等因素有关。这突显了气候变化背景下,即使是在传统意义上的丰水期,地下水系统也面临着巨大的压力。
本研究成功证明,结合了邻近观测井信息的空间随机森林插值(RFSI)模型,在区域尺度高空间分辨率地下水位预测方面具有显著优势。它不仅显著提升了预测精度,特别是缓解了对深井水位低估的问题,而且计算效率高于RFsp和SVM模型,尤其适用于大训练数据集和高分辨率制图。研究所产生的长达22年、月度、1 km2分辨率的勃兰登堡地区地下水位数据集,是理解和模拟该地区水资源动态、农业生产力、生态系统服务以及温室气体排放的宝贵基础数据。尽管模型在极端深水位预测和处理长时间序列数据动态变化方面仍存在局限,但此项研究为利用机器学习和多源数据解决复杂环境问题提供了强有力的范例。它强调了在机器学习模型中显式考虑空间依赖性的重要性,并为区域水资源可持续管理、气候变化影响评估和适应策略制定提供了关键的科学工具和数据支持。未来,通过融入更多水文地质参数、结合物理机制模型以及应用更先进的深度学习技术,有望进一步推动地下水预测科学的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号