《Environmental Modelling & Software》:An Ensemble Method for Integrating Rainfall Forecast Products Based on Average Mutual Information Decomposition
编辑推荐:
准确降雨预报对水库调度至关重要,传统多模型集合预报(MME)采用静态权重,无法针对不同降雨强度优化决策。本研究提出基于归一化平均互信息分解(AMI)的动态权重MME-MID框架,通过信息分解与不确定性分解分别优化洪季(减少漏报率5.5%)和灾后季(降低误报率11%)的预报效果,验证其在哒户坊和欢仁水库流域的有效性。
魏丁|任明蕾|宁炜伟|李轩|张金楠|周慧成
大连工业大学水利工程学院,中国大连116024
摘要
准确的降雨预报对水库运行至关重要,它将重点从减少洪水季节的漏报转向降低洪水后的误报。传统的多模型集成(MME)方法使用静态权重,忽略了不同降雨强度下的预报技巧差异。本研究提出了MME-MID,这是一种利用归一化平均互信息分解(Normalized Average Mutual Information Decomposition)根据降雨强度动态分配权重的新框架。应用了两种分解方法:(1)不确定性分解优先考虑高精度类别,以减少洪水后的误报;(2)信息分解增强了洪水季节高强度事件的检测能力。在达霍方(Dahuofang)和环仁(Huanren)流域的验证表明,与传统的MME相比,MME-MID在洪水季节将漏报率降低了5.5%,在洪水后将误报率降低了11%,同时没有增加总体误差,显著提高了决策的可靠性。
引言
准确的降雨预报对水库运行至关重要,其管理重点随季节而变化。在主要洪水季节,防洪是首要任务,漏报高强度降雨事件会带来重大风险。相比之下,洪水后的主要目标是蓄水,此时对强降雨的误报可能导致不必要的放水,从而减少蓄水效益。这种运营需求的差异要求预报产品不仅具有较高的总体准确性,还要在策略上优化以抑制特定类型的错误,即主要洪水季节的漏报和洪水后的误报。
数值天气预报的进步以及国际努力(如TIGGE)使得可以从多个机构(例如CMA、ECMWF和NCEP)获取多样的降雨预报(Shu等人,2021年)。模型动力学、物理特性、分辨率和地形的不同导致这些产品之间的误差特征各异。因此,多模型集成(MME)预报已成为一种广泛使用的策略,用于减少系统偏差并利用不同模型的互补技巧(Lee等人,2011年;Krishnamurti等人,2001年、2009年、2016年)。
传统的MME方法包括简单集成均值(EMN)(Iglesias等人,2022年)、去偏集成均值(BREM)(Park等人,2008年)、超级集成预报(SUP)(Krishnamurti等人,2000年)、卡尔曼滤波器(He等人,2015年;Bach和Ghil,2023年)以及机器学习(ML)等(Feng等人,2011年;Kumar等人,2012年;Pakdaman等人,2020年、2022年;Yang等人,2022年)。EMN和BREM方法因其简单性和在一定程度上提高预报准确性的能力而被广泛使用(Zhi等人,2012年;Krishnamurti等人,2016年)。然而,这些方法对不同的预报产品赋予相同的权重,限制了它们充分利用高精度预报的能力(Krishnamurti等人,2016年)。为了解决这一限制,SUP方法应用多元线性回归,能够分配正负权重来纠正系统偏差并预测超出单个模型范围的结果(Krishnamurti等人,1999年、2001年、2007年、2009年)。但EMN、BREM和SUP假设线性关系,而在复杂的水文气象过程中这种假设经常不成立。机器学习技术,如支持向量机(SVM)(Pakdaman等人,2022年)、极端梯度提升树(XGBoost)、极端学习机(ELM)和人工神经网络(ANN)(Kumar等人,2012年;Pakdaman等人,2020年、2022年),通过捕捉非线性关系提供了强大的替代方案。这些方法在总体准确性上显示出改进。然而,它们通常依赖于静态或全局优化的权重,并隐含地平等对待所有降雨类别(Ke等人,2008年)。例如,Ke等人(2008年)应用SUP和SVD方法进行多降雨集成预报,主要目标是最小化总体预报误差。鉴于轻降雨事件既频繁又可预测,而强降雨事件则罕见且充满不确定性(Shah等人,2018年),传统的MME方法倾向于高估低强度降雨并低估高强度降雨。尽管最近有尝试通过优先考虑强降雨条件下的最佳表现模型来缓解这一限制(VETROV和KOSTAREV,2021年),但仍然缺乏一个通用且基于原则的框架来推导动态的、特定类别的集成权重。
这一差距激发了对平均互信息(AMI)的探索。AMI量化了两个随机变量之间的非线性依赖关系(Gong等人,2013年;Hughes等人,2017年;Ning等人,2022年)。AMI分解可以将两个随机变量之间的总体信息分解为来自特定类别或事件的贡献(Blachman,1968年;Deweese和Meister,1999年;Butts,2003年)。这一特性使得AMI分解在计算神经科学(Butts,2003年;Bezzi,2007年、2010年;Duan等人,2016年;Kumar等人,2018年)、大气科学(Schneider和Griffies,1999年;DelSole,2004a;DelSole和Tippett,2007a;Cheng等人,2011年;Tang等人,2014年)、流行病学(Hughes,2012年;Hughes等人,2017年)、环境科学(Topp等人,2013年)和图像信息处理(Rigau等人,2011年)中得到广泛应用。在水文学中,降雨、流量和水质等变量通常按强度分类,使得AMI分解成为评估特定类别预报技巧的自然方法(Cover和Thomas,2006年;Singh,2013年;Gong等人,2013年、2014年;Hughes等人,2017年)。Ning等人(2022年)使用这种方法评估了确定性多类别降雨预报的不确定性。然而,这一概念尚未被整合到MME框架中,以推导动态的、类别依赖的集成权重。
为了解决这一差距,本研究开发了一种基于互信息分解的多模型集成方法(MME-MID)。该框架的核心创新是根据分解后的AMI组件动态分配权重给各个成员预报。这种方法特别符合水库运营在不同季节的对比目标:(1)在洪水后季节确保蓄水效益,使用不确定性分解,为不确定性较小的类别赋予更高权重,并有助于减少误报;(2)在主要洪水季节确保防洪,使用信息分解为携带更多信息信号的类别赋予更高权重,帮助减少高强度降雨的漏报。这些方法支持为实时降雨预报集成分配动态的、特定类别的权重。所提出的MME-MID框架使用达霍方和环仁水库流域的降雨预报进行了评估。
方法论
基于互信息分解的多模型集成方法(MME-MID)如图1所示。首先使用一组性能指标评估多个降雨预报产品,然后通过加权求和集成方法将预报结果整合在一起。集成权重来自互信息的信息分解和不确定性分解。
案例研究
达霍方水库位于中国浑河中上游地区,流域面积为5,437平方公里(见图3)。它调节年平均径流量为15.2亿立方米,气候特征为年平均降雨量780毫米,平均温度5.5摄氏度。作为辽宁省最大的水库,其主要功能是防洪和供水。它保护下游的城市中心(如沈阳和抚顺)和农田免受洪水侵袭。
单个降雨预报产品的评估
在整合之前,使用以下评估指标(Wilks,2019年)评估了每个产品的24小时预报性能。
当预报降雨类别低于观测类别时,就会发生漏报(例如,预报为2级;观测为3级)。漏报率(用 表示)和漏报事件总数(用 表示),其中