水文系统受到空间异质性和时间依赖性的影响(Bl?schl和Sivapalan,1995年;McDonnell等人,2007年;Teuling等人,2010年)。由于流域属性(如土壤、含水层连接、河道网络和土地利用)、水储存及其空间分布以及管理措施的不同,两个相邻的流域对同一风暴的反应可能大相径庭(Sawicz等人,2011年)。因此,月度径流模拟和预测需要能够从流域间的共性中学习同时保留流域特定行为的模型(Ahn等人,2017年)。贝叶斯层次模型(BHMs)正是为此目的而设计的。通过将参数按地点进行结构化变化,并通过部分池化向组分布过渡,BHMs在数据较少时稳定了推断,减少了过拟合,并保留了具有明确水文意义的参数,例如,持久性作为储存的代理,以及降雨滞后作为延迟径流的指标,而不是作为一个黑箱(Gelman和Hill,2007年;Gelman等人,2013年;McElreath,2020年;Ossandón等人,2022年;Collins等人,2025年)。此外,BHMs自然地与现代贝叶斯工作流工具集成,用于模型比较和验证,包括Pareto–smoothed importance sampling leave–one–out cross–validation(PSIS–LOO),从而能够透明地评估模型的精确度和校准(Hersbach,2000年;Gneiting和Raftery,2007年;Vehtari等人,2017年)。PSIS-LOO是一种高效的方法,可以在不重新拟合模型的情况下估计多次leave-one-out交叉验证。
N 。它使用重要性抽样来近似完整数据后验的每次“leave-one-out”后验。
贝叶斯推断在水文学中的作用已久,涵盖了参数估计、输入和结构误差处理以及概念性降雨-径流模型中的预测不确定性量化(Beven和Binley,1992年;Kuczera和Parent,1998年;Montanari和Toth,2007年;Beven,2006年;Wang等人,2013年)。贝叶斯总误差分析框架形式化了输入和模型误差的层次化处理(Kavetski等人,2006a年;Kavetski等人,2006b年),而后续研究展示了后验预测分布如何提高决策相关性(Gupta等人,2008年;Renard等人,2010年)。马尔科夫链蒙特卡洛(MCMC)和近似推断(例如,差分进化MCMC、自适应算法)的方法论进展使得高维后验探索在水文模型中变得实用(Vrugt等人,2009年;Laloy和Vrugt,2012年)。数据同化和状态-参数估计的并行发展进一步突出了概率框架在月度到季节性时间尺度上的价值(Moradkhani等人,2005年;Clark等人,2011年)。
第二个研究方向强调区域化和多站点建模,其中层次结构跨站点借用力量来改进估计和预测,当单个记录较短或非平稳时。应用包括区域洪水频率分析、极端事件的时空层次结构以及多流域径流建模,一致表明部分池化可以在不掩盖真实空间差异的情况下提高预测能力(Krzysztofowicz,1999年;Yapo等人,1998年;Kuczera和Parent,1998年;Lao和Tamea,2007年;Yan等人,2016年)。第三个研究方向关注季节性预测和气候条件。贝叶斯联合概率(BJP)框架及相关方法提供了具有可解释参数的连贯的、考虑分布的多站点季节性径流预测,并仔细处理了预测因子转换和依赖性(Wang等人,2009年;Lima和Lall,2010年;Wang和Robertson,2011年;Schepen等人,2018年;Samal等人,2023年;Javanshiri等人,2024年)。
虽然许多成功的研究利用了基于物理的降雨-径流模型或气候条件化的集合模型,但实际操作通常需要一个更简单的月度尺度表示,其参数能够清晰地映射到水文概念,并且可以通过人员更替和不断变化的数据流进行维护(Gupta等人,2008年)。我们认为,一个具有流域特定系数的BHMs,这些系数涉及滞后径流(持久性/储存)和滞后降雨(延迟径流),并在相邻流域间进行池化,直接满足了这一需求。部分池化先验将嘈杂的站点级估计向组分布收缩,从而减少了方差并提高了样本外性能。同时,后验仍然通过不同的滞后权重反映了真实的储存行为差异。由于PSISLOO在诊断有影响力案例的同时评估了泛化能力,因此得到的工作流程既严格又透明(Vehtari等人,2017年;Gneiting和Raftery,2007年;Hamill,2001年;Wilks,2011年)。最近的机器学习和深度学习方法,包括基于LSTM的降雨-径流模型,在大型水文数据集上进行训练时展示了强大的预测能力(Kratzert等人,2018年;Kratzert等人,2019年)。然而,这些方法通常作为高度灵活的函数逼近器实现,不确定性量化和过程归因通常需要超出点预测的额外设计选择(Reichstein等人,2019年;Nearing等人,2021年)。相比之下,BHMs指定了一个具有层次化先验的显式概率数据生成模型,产生了连贯的后验预测分布,允许在记录有限或异质的情况下跨流域进行部分池化(借用力量),并保留了具有直接水文解释的参数,支持透明的诊断和以决策为中心的不确定性沟通。
这项研究的动机是一个现实世界的水资源问题。美国佛罗里达州的坦帕湾地区依赖多个水源来满足区域水资源需求。两个相邻的流域,即阿拉菲亚河和希尔斯伯勒河,在运营上非常重要,但它们的储存特性却大相径庭。希尔斯伯勒河流域表现出更强的月度记忆性和对累积降雨的更大延迟响应。由于月度径流模拟用于规划地表水收集、水库目标和与地下水的联合运营,因此需要一个在参数层面上可解释的模型。该模型还应利用相邻流域共享的信息,并提供校准的预测分布。本研究提出了一个基于历史数据的简化、可解释的统计层次结构,而不是采用基于物理的水文模型。核心思想是通过流域特定的系数对滞后径流和降雨进行编码,这些系数在层次化先验下跨两个流域进行信息池化。
本研究考虑了两个模型。M0是一个没有明确季节性的多流域基线模型,每个流域都有一个截距以及最近一个月的径流和短期滞后(1-3个月)降雨的系数。这些参数在流域间部分池化以稳定估计。M1通过在湿/干季节中调整截距来增强M0,而不复杂化斜率项。这两个模型都针对月度时间尺度,并使用Stan的NoUTurn Sampler(NUTS)中的Hamiltonian Monte Carlo进行拟合,从而能够稳健地探索后验几何形状并进行直接的后验预测检验(Gelman等人,2013年;McElreath,2020年)。使用PSIS-LOO比较了M0和M1,并使用均方误差和相关性评估了后验预测均值(Gneiting和Raftery,2007年;Hersbach,2000年;Hamill,2001年;Lao和Tamea,2007年;Vehtari等人,2017年)。
从方法论上讲,这项研究的贡献是一个用于模拟具有不同储存特征的相邻流域月度径流的可解释BHMs框架,完全基于历史观测数据构建。参数具有直接的水文意义。持久性系数代表地下和径流路径的记忆;降雨滞后权重量化了延迟径流的贡献;季节性截距(在M1中)编码了不同季节之间的水平变化;残差尺度总结了未解释的变异性。实际上,应用于两个坦帕湾流域的案例表明,跨流域池化可以在不掩盖真实储存差异的情况下提高预测能力。这种方法具有通用性和可扩展性,可以根据需要添加气候信息预测因子、多流域网络结构和自适应训练窗口,前提是它们能够在不牺牲可解释性的情况下提高预测能力(Wang和Robertson,2011年;Samal等人,2023年)。