《Advances in Water Resources》:Mixed Copula for streamflow simulation based on intelligent knowledge set and parameter calibration using cooperation search algorithm
编辑推荐:
研究提出融合智能知识集与合作搜索算法的新型混合Copula流量模拟方法,有效解决传统Copula模型参数冗余、计算效率低和拟合精度不足问题。通过两维(Qt,Qt-1)和三维(Qt,Qt-1,Qt-2)混合Copula模型实现,参数减少99%,计算时间缩短至传统方法的3-4%,精度提升5-15%。该方法为水文管理提供高效精准的技术工具。
夏一帆|冯中凯|肖阳|张涛涛|孔令忠|牛文静|张慧明
中国河海大学水灾害防治国家重点实验室,南京,210098
摘要
流量模拟在水库运营和水资源科学管理中起着至关重要的作用。本研究提出了一种新的流量模拟方法,该方法结合了混合Copula方法、智能知识库和合作搜索算法进行参数优化。该方法解决了传统基于Copula模型的局限性,如表达能力有限、模型参数过多以及计算时间过长等问题。首先,利用时间序列模型建立智能知识库;然后使用合作搜索算法估计模型参数;最后通过条件Copula生成模拟流量值。理论分析表明,与传统方法相比,该方法显著降低了计算复杂度。在多个水文站的工程应用中验证,该方法可将参数数量减少99%以上,将估计时间缩短至传统方法的3-4%,并提高5-15%的准确性。这种新方法将智能知识库与参数优化相结合,提高了流量模拟的精度,为流域管理提供了宝贵的技术工具。
引言
流量动态是水文学中的一个关键领域,涵盖了水文循环的各个方面(Sugimoto等人,2016;Chen等人,2016)。然而,观测到的水文数据集通常存在时间跨度短、数据不完整以及极端事件覆盖稀疏等限制(Zhang等人,2025;Xia等人,2026)。这些限制使得模型难以准确捕捉流量的随机特性并预测未来的极端事件(Luo,2003;Liu等人,2022)。为了解决这些挑战,研究人员积极开发了高效的随机模拟方法。这些方法旨在利用有限的数据生成足够长度的水文时间序列,以捕捉对大规模水资源管理项目至关重要的统计特征(Coxon等人,2015;Patskoski和Sankarasubramanian,2018)。
目前的流量模拟方法主要包括自回归模型、生成式深度学习模型和Copula模型(Feng等人,2026)。自回归模型通过拟合历史数据在多种条件下生成多源数据集(Chen等人,2019;Sharma和O'Neill,2002)。尽管它们在结构简单性和操作灵活性方面具有优势,但受限于可扩展性和参数敏感性(Zhang等人,2022;Mehdizadeh等人,2019)。这些限制导致误差累积,从而影响模拟质量(Oh和Parron,2017)。生成对抗网络(GANs)是一种深度学习模型,通过对抗框架实现水文数据模拟:生成器学习生成类似于真实观测的数据,而判别器区分真实数据和生成数据,两个网络通过迭代进行优化(Feng等人,2025;Belhajjam等人,2024;Ershadnia等人,2024)。这类深度学习模型具有很强的泛化能力和适应性,但其实际应用受到可解释性差、训练复杂度高和计算成本大的阻碍(Li等人,2024;Dong等人,2022)。相比之下,Copula模型能够独立描述边际分布和依赖结构,显著提高了对随机变量各种分布的适应性,捕捉变量之间的复杂依赖关系,并具有灵活的操作性和强大的可解释性(Fan等人,2016;Grimaldi和Serinaldi,2006)。通过消除归一化变换的需求,Copula模型提高了鲁棒性(Dong等人,2022;Li和Zheng,2016)。它们在构建联合分布和计算效率方面的灵活性确保了流量数据中多变量统计特征的准确可靠表示(Yazdandoost等人,2021;Pereira等人,2017;Slater和Villarini,2018)。然而,在流量模拟中,水文变量的边际分布及其依赖结构表现出显著的时间变异性。不同类型的Copula在描述不同变量集合的依赖结构方面适用性不同,因此需要为每个模型独立确定最优的Copula类型。此外,对于具有复杂尾部相关性的流量序列组合,单一类型的Copula模型往往不足以准确描述其依赖关系特征(Wang等人,2024)。
为了解决单一Copula模拟中存在的问题,研究人员越来越多地采用混合Copula模型。这些模型通过组合多个Copula函数来捕捉不同变量组合之间的多样依赖特性。混合Copula模型通过权重因子结合多种Copula类型,增强了描述复杂依赖结构的能力。通过整合具有不同属性的Copula并优化其参数,模型在处理水文变量的复杂联合分布时表现出更大的灵活性(Brunner等人,2019;Yamaka等人,2023)。尽管混合Copula在描述多变量联合分布方面具有优势,但其参数估计仍面临重大挑战。随着Copula类型的增加,需要估计的参数数量(包括权重和各个Copula本身的参数)大幅增加,提高了参数空间的维度(Liu等人,2017)。主流的最大似然估计方法在这种条件下遇到困难。为了解决同时估计边际分布参数和Copula参数时产生的高维挑战,边际推断函数(IFM)方法将这两个估计过程分开,并分别应用最大似然方法(Liu等人,2020;Bai等人,2020)。这有效降低了计算复杂度并提高了估计效率。然而,IFM方法仅分离了边际分布和Copula的估计过程(Nguyen等人,2016)。当Copula函数本身维度较高时,其参数的最大似然估计在高维优化中仍会遇到困难。在高维参数空间中,似然函数经常表现出多模态和平坦区域,导致传统优化算法频繁收敛到局部最优解。参数约束和边界奇异性进一步增加了寻找全局最优解的难度,并降低了计算效率。此外,估计过程对初始值非常敏感,可能导致收敛到次优解,从而扭曲权重估计的准确性。这增加了参数估计的方差,并可能导致关键特征(如尾部依赖性)的错误表征,从而影响模型的可靠性。当前研究尚未充分解决混合Copula模型中参数的时间演变问题。这一限制限制了模型表示动态依赖结构的能力,并加剧了参数估计的复杂性。
本研究解决了现有基于混合Copula的流量模拟中的三个核心问题:参数冗余、联合分布拟合精度不足和计算效率低下。为此,制定了明确的研究目标,具体包括:构建参数智能知识库以减少参数冗余;通过结合合作搜索算法(CSA)和RMSE同步提高拟合精度和计算效率。具体的流量模拟方法如下:基于构建的智能知识库,建立二维和三维混合Copula模型,并通过CSA校准其参数。随后构建条件Copula并进行采样以实现流量模拟。二维模型使用Qt和Qt-1作为变量,而三维模型使用Qt、Qt-1和Qt-2作为变量,两种模型均用于流量模拟。为了突出所提方法的优势,本研究采用了现有文献中的主流传统单一Copula模型和混合Copula模型作为比较基准,并整合了三种经典单一Copula(Frank、Gumbel和Clayton),以覆盖不同的变量依赖结构。在选择Copula维度时,二维和三维结构基于双重考虑:它们符合流量时间演变规律和流量生成-集中的内在机制。二维结构(Qt、Qt-1)捕捉相邻时间步之间的即时依赖性,而三维结构(Qt、Qt-1、Qt-2)表征长期滞后协同效应。此外,这些结构避免了高维Copula模型导致的计算复杂性急剧增加。
本文的结构如下:第2节概述了基于智能知识库和参数优化的混合Copula流量模拟方法。第3节展示了使用不同河流流域多个站点的历史数据进行流量模拟的应用。第4节总结了研究的主要发现和意义。
方法论
图1展示了所提出方法和传统混合Copula流量模拟的流程图。所提出的方法推迟了参数校准过程,构建了智能知识库,并利用CSA进行优化,从而实现了高效的参数校准。在本节中,本文提出了一种专门为处理需要构建多个Copula的复杂场景而设计的创新混合Copula模型,例如日流量模拟
数据集描述
本研究使用了来自不同大陆多个站点的历史流量数据,包括中国甘河流域的怀洲站;美国密苏里河流域的Rulo站、堪萨斯城站、Boonville站、Hermann站和Nebraska City站;波兰奥德河流域的Gozdowice站;以及纳米比亚Kunene河流域的Ruacana站。所提出的方法为每个站点建立了二维和三维模型进行单站流量模拟
结论
流量模拟对于水资源管理、洪水预测、水力系统设计和环境保护至关重要。Copula能够准确描述多个变量的联合分布,在捕捉水文过程中的复杂依赖关系中起着关键作用。然而,日流量模拟经常面临高维Copula模型的挑战,包括参数估计和拟合精度问题
作者声明
夏一帆(第一作者):撰写——原始草稿,撰写——审稿与编辑。
冯中凯(通讯作者):资金获取,撰写——审稿与编辑。
肖阳:数据整理。
张涛涛:数据整理。
牛文静:形式分析。
张慧明:数据整理。