基于机器学习解析美国本土不同气候区流域的径流退水模式及其水文动力学意义
《Water Resources Research》:Machine Learning Analysis of Streamflow Recession Patterns Across Climates in the Contiguous United States
【字体:
大
中
小
】
时间:2025年10月19日
来源:Water Resources Research 5
编辑推荐:
本文创新性地将长短期记忆网络(LSTM)机器学习方法应用于美国本土不同气候带流域的径流退水分析,揭示了传统幂律拟合与相空间中“吸引子”轨迹的异同,挑战了传统水力地下水理论对低流动力学的解释,为理解气候如何影响流域储水-释水过程提供了新视角。
径流退水分析长期以来是水文研究的重点,旨在帮助预测低流量,特别是在无测站流域,以建立气候、物理流域特征与退水动力学之间的可靠关系。传统方法集中在“退水图”上,即在双对数坐标散点图中展示径流负时间导数(-dQ/dt)与径流量(Q)的关系。常规方法通过幂律形式dQ/dt = -aQb来捕捉动力学的非线性,其中b是双对数空间中线性关系的斜率。这一方法避免了非线性储流动力学中降雨事件后时间参考点的不确定性。然而,点云的散布受时变流域动力学和外部强迫影响,且关于能从这些图中综合何种信息仍存在分歧。近年来,研究转向分析单个退水事件而非整体点云,发现单个事件通常具有更陡的斜率和更大的非线性,与点云分析得出的平均模式存在根本脱节。Kim等人(2023)引入长短期记忆网络(LSTM)机器学习方法进行退水分析,解释了点云的散布并预测单个事件轨迹,揭示了相空间中的吸引子,表明单个退水事件会收敛到一个共同的轨迹。本研究将该方法应用于美国本土(CONUS)代表气候变异性的流域,以识别和理解不同气候类型下吸引子的结构,并探讨该方法在各种气候条件下的局限性。
退水分析起源于使用-dQ/dt与Q的关系图。本研究采用-dQ/dt与Q的关系,其函数等同于Kirchner(2009)使用的流域敏感性函数,旨在捕捉排水对储水变化的敏感性。在传统退水图中使用幂函数表征形状时,该幂函数也可用于-dQ/dt与Q图,其指数减一。生成退水图的关键组成部分是使用日分辨率径流时间序列估算-dQ/dt,本研究采用恒定时间步长方法。退水事件定义为降水量(P)为零且径流下降的时期,未强制执行最小事件长度,也未从记录中移除峰后天数。流域敏感性函数并非一对一的,事件研究指出由记忆效应引起的响应变异性。因此,使用过去一定长度的排放轨迹而非单一值来估计流域敏感性函数,以捕捉滞后效应。模型写作?(Q) = f(θt),其中f是非线性滞后函数,θt是过去的排放轨迹。使用高斯核密度估计来突出建模点云中的密集区域。
采用Berghuijs等人(2014)的气候定义对流域进行分类,该框架根据三个水文气候指数(干旱指数、季节性和雪冰比例)将美国本土流域分为10个类别。干旱指数是年平均潜在蒸发量与年平均降水量的比值;季节性指数代表降水与潜在蒸发量和温度同相的程度,范围从-1到1;雪冰比例是气温低于冰点时降水量的比例。选定的9个流域代表9种气候分类(B2类缺失),均来自模型参数估计实验(MOPEX)数据集,要求具有30年高质量日径流和降水数据,且面积相似。使用美国地质调查局的土地变化监测、评估和预测数据评估了1985年至2000年主要土地利用的变化,以排除城市化面积大或土地用途发生显著变化的流域。
所选九个流域代表了广泛的水文行为。具有冬季主导降水和高雪冰比例的A类和B类流域(如Coeur D'alene河、Klickitat河、Carson河、Lochsa河)显示出与大雪量和负季节性相关的年度上升和下降支。内华达州的Carson河流域(A3)是这种模式的极端例子,夏季流量在大多数年份降至接近零。德克萨斯州的Guadalupe河流域(C2)也偶尔出现夏季流量急剧下降。A3、C1、C2和D1流域观测到低于0.01毫米/天的低流量。最稳定的流域是A2和D2,具有最平坦的流量历时曲线和最低的年际变异性。密西西比州的Pearl河流域(D1)显示出最大的流量变异性。
使用长短期记忆网络模型,结构包括一个LSTM层、一个丢弃层、第二个LSTM层和一个最终的线性层。丢弃层用于通过随机将部分变量设为零来降低过拟合风险。训练期间使用的损失函数是平均绝对误差,优化器设置为Adam,固定学习率为0.001。完整数据集包括从1970年10月1日到2000年9月30日的30年日数据。退水事件根据标准从该数据集中识别,占数据的5%–25%。在训练之前,对?和Q值进行标准化。前10年的数据用于训练模型,其余20年用于评估结果。训练三个模型,每个模型使用不同的过去轨迹输入序列长度(1天、5天和10天)。通过网格搜索为每个流域选择最佳超参数集。
观测到的退水事件点云、分箱数据、拟合的幂函数以及1天和5天LSTM模型结果显示,拟合的幂函数的b值在1到2之间,与之前的工作一致。1天模型结果通常与分箱数据一致,但比拟合的幂函数提供更多结构。1天模型结果是单射函数,流域敏感性函数?与径流量呈一对一关系。5天模型结果捕捉了点云中代表观测事件变异性的部分散布,这是由于考虑了过去5天排放的不同模式。然而,这种变异性在不同流域的捕捉程度不同。A类流域的5天模型结果几乎没有比1天模型结果捕捉到更多变异性,而C类和D类流域的模型结果能够覆盖观测事件中?值范围的更大部分。B1和D3流域显示出中等程度的改进。
将过去轨迹长度延长至10天对A类流域与其他流域产生相反效果。A类流域的10天模型结果具有更分散的点云,更好地匹配观测数据的变异性,而其他流域的10天模型结果产生略微更受限的点云和更线性的吸引子。这些定性观察得到性能指标的支持。另一个关键组成部分是比较模型对单个退水事件的?预测与观测轨迹。模型在预测这些事件方面表现出广泛的能力范围,从紧密捕捉事件的形状和轨迹到严重歪曲整个退水事件的斜率变化。
模型在退水图中显示的不同特征揭示了气候与退水动力学之间的潜在联系。最干旱的流域(A3和C2)在低流量时的高?值显著影响回归线的斜率,降低了其用于估计所有退水事件?值的效用。然而,干旱度似乎并不是机器学习模型捕捉退水图中滞后现象能力的主要因素。季节性和其他水文图特征可以解释性能差异。研究发现,异相季节性与机器学习模型捕捉退水图中变异性的能力之间存在强烈联系。所有四个具有中度至强度异相降水和显著降雪比例的A类和B类流域,由于变异性主要由季节尺度过程(如融雪对水文图的贡献)驱动,而非事件尺度过程,5天建模点云仍然密集聚集在1天建模值周围,未能捕捉观测中的变异性。尽管增加输入长度有所帮助,但仍不足以捕捉变异性的完整季节尺度。
两个流域在相空间中显示出可区分的季节性形式。伊利诺伊州的Spoon河(C1)在建模点云中可见两个不同的密集区域,由流量大小分隔,表明退水图中可能存在两个不同的季节性吸引子。密西西比州的Pearl河(D1)则主要通过退水事件斜率的差异来区分,可能代表另一种季节性形式。季节性模型性能的差异并不完全由退水事件的数量和长度分布解释。
所有机器学习点云都显示出可被单独解释为吸引子的密集区域,但其有效性需要额外证据支持。判断吸引子有效性的标准是建模退水事件与最长观测退水事件的形状紧密吻合,同时收敛到图中的密集区域。基于这些标准,9个流域中有4个显示证据表明机器学习识别出的吸引子是对退水动力学的有效解释。一个有趣的发现是,一些吸引子在相空间中是非线性的,从而揭示了与水力地下水理论不同的流动动力学。
除了气候影响,此分析有助于深入了解退水分析对各种流域的普遍适用性,以及使用机器学习进行此类分析的价值。尽管模型性能相对有限,但最佳性能模型的点云度量决定系数仅为0.72,表明预测质量有提升空间。潜在因素包括本研究使用的流域面积明显大于文献中通常使用的面积,较大流域内异质性可能影响数据,且收敛到吸引子的时间可能延长。数据中的噪声是另一个重要因素,当数据中存在显著噪声时,高度量值并不理想,可能是过拟合的迹象。
关于退水选择标准的讨论指出,放宽降水为零的限制或施加最小退水长度可能会提供更长的退水事件,使其有时间收敛到吸引子。改变观测点云的?值估算方法也可能改进分析。
在方法学上,选择对每个流域独立训练模型是基于工作的探索性性质和数据集的局限性。未来的研究可以使用更广泛的数据集探索区域或全球退水模型的开发。数据分割和验证策略(前10年训练,后20年验证)遵循Kim等人(2023),侧重于理解动力学而非预测预报。输入序列长度的选择被证明是一个重要因素,不同流域类型的最佳长度不同,表明输入长度的选择需要根据流域特征仔细考虑。
本研究使用机器学习模型以及已建立的退水分析方法,探索了美国本土气候梯度上的各种流域动力学,同时测试了使用机器学习方法调和退水分析两种不同解释的一致性。在代表的9种气候流域中观察到建模点云的各种模式。干旱度本身并不是模型检测潜在吸引子能力的强控制因素。然而,异相季节性、高雪冰比例及其对退水事件长度的 resultant 影响显著影响模型性能,尤其是在捕捉观测点云变异性所需的适当过去轨迹长度方面,较长的过去轨迹改善了具有显著异相季节性的流域的建模点云性能。退水事件特征(如流量大小和退水曲线斜率)的季节性差异也可能解释模型性能的差异和潜在吸引子的位置。
尽管所有模型在总点云度量上表现有限,但几个捕捉了观测点云变异性的模型在仅针对较长的单个退水事件进行测试时也表现良好,表明模型能够恢复流域退水动力学中的潜在吸引子。在其他流域,建模点云捕捉了一般变异性,但单个退水事件表示不佳,松散的事件选择标准可能允许机器学习退水动力学,但通过改进退水选择标准和改变观测数据的?值估算方法可能会改善分析。也存在变异性未被该方法捕捉的流域,最显著的是Carson河(A3)流域,其高干旱度、间歇性、异相降水和水文图的平坦部分阻止模型学习任何有价值的模式或捕捉观测点云中超越吸引子的季节性变异性的重要组成部分。
Lochsa河、Spoon河、New河和Chenango河流域(B1、C1、D2和D3)中建议的吸引子表明,尽管存在局限性,此类模型可以识别不同流域和气候下退水动力学中的模式。建模点云与单个退水事件性能的混合分析进一步指出了整体和基于事件的退水分析方法之间和解的可能性。
这项工作为后续研究提供了许多途径。总建模点云性能的困难指向关于训练数据中适当流域数量、模型训练和性能评估中训练/验证/测试数据比例的使用、以及不同流域建模退水事件时最有效的过去轨迹长度的重要问题。另一个悬而未决的问题是流域大小在模拟流域动力学能力中的作用。后续研究可以控制气候和地质条件,同时观察不同大小的流域,以确定空间尺度对模型性能的影响。另一个主题将聚焦于季节性吸引子的可能性,并更好地探索观察到的不同退水动力学的潜在控制因素。这可以通过使用合成数据来控制季节性的表达并强调水文图中观察到的不同径流模式的独特性质来实现。这些研究可以将讨论带回到优先考虑与地下特性关系的径流退水分析起源,进一步阐明如何利用流域动力学来推断其结构信息。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号