可解释的层次贝叶斯模型用于异质流域的月流量预测:两个流域的对比研究

《Journal of Hydrology》:Interpretable hierarchical Bayesian modeling of monthly streamflow for heterogeneous basins: A comparative study of two basins

【字体: 时间:2026年03月28日 来源:Journal of Hydrology 6.3

编辑推荐:

  月度流量模拟中贝叶斯分层模型的应用研究。针对佛罗里达州坦帕湾地区两个水文特性差异显著的流域,构建了包含基础模型M0(无显式季节性)和增强模型M1(引入季节截距调整)的贝叶斯分层模型(BHMs),通过参数层面揭示流域存储差异,验证了部分合并方法在提升模型鲁棒性的同时保留区域特性的有效性,并建立可解释的水文参数体系。

  
王辉|Manoj Shrestha|Tirusew Asefa|王定宝
美国佛罗里达州坦帕湾水域,克利尔沃特,邮编33763

摘要

贝叶斯层次模型(BHMs)提供了一种结构化的方法,可以联合模拟具有显著水文储存差异的多个流域,同时利用短期记录中的共享信息。本研究探讨了两种可解释的BHMs,用于模拟美国佛罗里达州坦帕湾地区的月度径流。第一个模型M0是一个没有明确季节性的多流域基线模型;另一个模型M1通过将月份分为夏季和非夏季月份,增加了季节性截距调整。这种层次结构捕捉了流域间的共性,同时忠实反映了储存差异;M1进一步减少了季节性模式的条件偏差,且保持了最小的简约性损失。关键的是,这些参数具有直接的水文解释意义,而不是作为一个黑箱。持久性系数(即与滞后径流相关的参数)反映了流域的储存能力;与滞后降雨相关的参数量化了延迟径流的贡献;季节性截距表示了季节性水平的变化。在阿拉菲亚河(ALA)和莫里斯桥(MBR)处的希尔斯伯勒河上进行的部分池化稳定了推断,同时保留了揭示不同储存行为的独特滞后权重。该模型使用1981年至2018年的数据进行了拟合和评估,通过后验预测检验,包括均方误差、观测值与模拟值之间的相关性以及Pareto-Smoothed Importance Sampling Leave-One-Out(PSISLOO)方法。还比较了这两个模型在2019-2024年验证期间的性能。本研究的主要贡献是一个可解释的模拟框架,可以解释相邻流域之间储存响应的差异。这种方法具有通用性和可重复性,为特别是多流域环境中共享气候强迫与流域特定储存和径流特性相互作用的情况提供了稳健的径流预测途径。

引言

水文系统受到空间异质性和时间依赖性的影响(Bl?schl和Sivapalan,1995年;McDonnell等人,2007年;Teuling等人,2010年)。由于流域属性(如土壤、含水层连接、河道网络和土地利用)、水储存及其空间分布以及管理措施的不同,两个相邻的流域对同一风暴的反应可能大相径庭(Sawicz等人,2011年)。因此,月度径流模拟和预测需要能够从流域间的共性中学习同时保留流域特定行为的模型(Ahn等人,2017年)。贝叶斯层次模型(BHMs)正是为此目的而设计的。通过将参数按地点进行结构化变化,并通过部分池化向组分布过渡,BHMs在数据较少时稳定了推断,减少了过拟合,并保留了具有明确水文意义的参数,例如,持久性作为储存的代理,以及降雨滞后作为延迟径流的指标,而不是作为一个黑箱(Gelman和Hill,2007年;Gelman等人,2013年;McElreath,2020年;Ossandón等人,2022年;Collins等人,2025年)。此外,BHMs自然地与现代贝叶斯工作流工具集成,用于模型比较和验证,包括Pareto–smoothed importance sampling leave–one–out cross–validation(PSIS–LOO),从而能够透明地评估模型的精确度和校准(Hersbach,2000年;Gneiting和Raftery,2007年;Vehtari等人,2017年)。PSIS-LOO是一种高效的方法,可以在不重新拟合模型的情况下估计多次leave-one-out交叉验证。N。它使用重要性抽样来近似完整数据后验的每次“leave-one-out”后验。
贝叶斯推断在水文学中的作用已久,涵盖了参数估计、输入和结构误差处理以及概念性降雨-径流模型中的预测不确定性量化(Beven和Binley,1992年;Kuczera和Parent,1998年;Montanari和Toth,2007年;Beven,2006年;Wang等人,2013年)。贝叶斯总误差分析框架形式化了输入和模型误差的层次化处理(Kavetski等人,2006a年;Kavetski等人,2006b年),而后续研究展示了后验预测分布如何提高决策相关性(Gupta等人,2008年;Renard等人,2010年)。马尔科夫链蒙特卡洛(MCMC)和近似推断(例如,差分进化MCMC、自适应算法)的方法论进展使得高维后验探索在水文模型中变得实用(Vrugt等人,2009年;Laloy和Vrugt,2012年)。数据同化和状态-参数估计的并行发展进一步突出了概率框架在月度到季节性时间尺度上的价值(Moradkhani等人,2005年;Clark等人,2011年)。
第二个研究方向强调区域化和多站点建模,其中层次结构跨站点借用力量来改进估计和预测,当单个记录较短或非平稳时。应用包括区域洪水频率分析、极端事件的时空层次结构以及多流域径流建模,一致表明部分池化可以在不掩盖真实空间差异的情况下提高预测能力(Krzysztofowicz,1999年;Yapo等人,1998年;Kuczera和Parent,1998年;Lao和Tamea,2007年;Yan等人,2016年)。第三个研究方向关注季节性预测和气候条件。贝叶斯联合概率(BJP)框架及相关方法提供了具有可解释参数的连贯的、考虑分布的多站点季节性径流预测,并仔细处理了预测因子转换和依赖性(Wang等人,2009年;Lima和Lall,2010年;Wang和Robertson,2011年;Schepen等人,2018年;Samal等人,2023年;Javanshiri等人,2024年)。
虽然许多成功的研究利用了基于物理的降雨-径流模型或气候条件化的集合模型,但实际操作通常需要一个更简单的月度尺度表示,其参数能够清晰地映射到水文概念,并且可以通过人员更替和不断变化的数据流进行维护(Gupta等人,2008年)。我们认为,一个具有流域特定系数的BHMs,这些系数涉及滞后径流(持久性/储存)和滞后降雨(延迟径流),并在相邻流域间进行池化,直接满足了这一需求。部分池化先验将嘈杂的站点级估计向组分布收缩,从而减少了方差并提高了样本外性能。同时,后验仍然通过不同的滞后权重反映了真实的储存行为差异。由于PSISLOO在诊断有影响力案例的同时评估了泛化能力,因此得到的工作流程既严格又透明(Vehtari等人,2017年;Gneiting和Raftery,2007年;Hamill,2001年;Wilks,2011年)。最近的机器学习和深度学习方法,包括基于LSTM的降雨-径流模型,在大型水文数据集上进行训练时展示了强大的预测能力(Kratzert等人,2018年;Kratzert等人,2019年)。然而,这些方法通常作为高度灵活的函数逼近器实现,不确定性量化和过程归因通常需要超出点预测的额外设计选择(Reichstein等人,2019年;Nearing等人,2021年)。相比之下,BHMs指定了一个具有层次化先验的显式概率数据生成模型,产生了连贯的后验预测分布,允许在记录有限或异质的情况下跨流域进行部分池化(借用力量),并保留了具有直接水文解释的参数,支持透明的诊断和以决策为中心的不确定性沟通。
这项研究的动机是一个现实世界的水资源问题。美国佛罗里达州的坦帕湾地区依赖多个水源来满足区域水资源需求。两个相邻的流域,即阿拉菲亚河和希尔斯伯勒河,在运营上非常重要,但它们的储存特性却大相径庭。希尔斯伯勒河流域表现出更强的月度记忆性和对累积降雨的更大延迟响应。由于月度径流模拟用于规划地表水收集、水库目标和与地下水的联合运营,因此需要一个在参数层面上可解释的模型。该模型还应利用相邻流域共享的信息,并提供校准的预测分布。本研究提出了一个基于历史数据的简化、可解释的统计层次结构,而不是采用基于物理的水文模型。核心思想是通过流域特定的系数对滞后径流和降雨进行编码,这些系数在层次化先验下跨两个流域进行信息池化。
本研究考虑了两个模型。M0是一个没有明确季节性的多流域基线模型,每个流域都有一个截距以及最近一个月的径流和短期滞后(1-3个月)降雨的系数。这些参数在流域间部分池化以稳定估计。M1通过在湿/干季节中调整截距来增强M0,而不复杂化斜率项。这两个模型都针对月度时间尺度,并使用Stan的NoUTurn Sampler(NUTS)中的Hamiltonian Monte Carlo进行拟合,从而能够稳健地探索后验几何形状并进行直接的后验预测检验(Gelman等人,2013年;McElreath,2020年)。使用PSIS-LOO比较了M0和M1,并使用均方误差和相关性评估了后验预测均值(Gneiting和Raftery,2007年;Hersbach,2000年;Hamill,2001年;Lao和Tamea,2007年;Vehtari等人,2017年)。
从方法论上讲,这项研究的贡献是一个用于模拟具有不同储存特征的相邻流域月度径流的可解释BHMs框架,完全基于历史观测数据构建。参数具有直接的水文意义。持久性系数代表地下和径流路径的记忆;降雨滞后权重量化了延迟径流的贡献;季节性截距(在M1中)编码了不同季节之间的水平变化;残差尺度总结了未解释的变异性。实际上,应用于两个坦帕湾流域的案例表明,跨流域池化可以在不掩盖真实储存差异的情况下提高预测能力。这种方法具有通用性和可扩展性,可以根据需要添加气候信息预测因子、多流域网络结构和自适应训练窗口,前提是它们能够在不牺牲可解释性的情况下提高预测能力(Wang和Robertson,2011年;Samal等人,2023年)。

研究区域

研究区域

本研究关注美国中西部佛罗里达州的两个相邻的地表水流域,即阿拉菲亚河流域(南部)和希尔斯伯勒河流域(北部)(图1a)。这两个流域都向西流入坦帕湾河口,是区域公共供水的主要来源。这些流域是连续的,并且具有相似的天气强迫,但由于储存特性的不同,它们的水文响应也有所不同。对于这项工作,我们分析了

收敛性诊断和后验分布

进行了马尔科夫链的收敛性诊断。两个模型的PSIS-LOO Pareto-k诊断结果显示在补充材料中的图S-1中。两个模型所有参数的收敛性诊断结果显示在补充材料中的图S-2中。结果表明所有参数的链混合和数值收敛性都非常好。
图3总结了标准化尺度上的流域特定斜率分布,显示了箱形图

结论

本研究开发并测试了一个可解释的贝叶斯层次框架,用于模拟两个具有不同储存行为的相邻佛罗里达流域的月度径流。基线模型(M0)通过全局结构在流域间池化信息,同时允许流域特定的随机截距和具有水文意义的预测因子(滞后流量和滞后降雨)的随机斜率。季节性变体(M1)在保持

未引用参考文献

Duan,1983年;Lai等人,2025年;Yao等人,2018年。

CRediT作者贡献声明

王辉:写作——审阅与编辑,撰写——原始草稿,软件,方法论,概念化。Manoj Shrestha:写作——审阅与编辑,可视化,验证,数据管理,概念化。Tirusew Asefa:写作——审阅与编辑,可视化,方法论,概念化。王定宝:写作——审阅与编辑,验证,方法论,概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号