BURGER:基于自下而上区域化方法的全球次小时尺度强度-历时-频率数据研究
【字体:
大
中
小
】
时间:2025年10月12日
来源:Water Resources Research 5
编辑推荐:
本文推荐一篇利用地面降雨观测和机器学习构建全球强度-历时-频率(IDF)曲线的研究。作者提出BURGER(自下而上区域化全球极端降雨)数据集,首次基于次小时降雨观测,采用简化 metastatistical 极值(SMEV)分布和随机森林回归,生成高空间分辨率(0.1°)的全球一致IDF产品。该数据在无观测区域表现可靠,为洪水风险管理提供重要支撑。
全球范围内的极端降雨可能引发严重的洪涝灾害,尤其是城市地区对短时强降雨事件极为脆弱。强度-历时-频率(IDF)曲线是描述降雨强度、历时和重现期之间关系的多维工具,常用于城市排水系统和防洪工程的设计。然而,由于地面观测站点的稀疏性——全球仅有低个位数百分比的地区有雨量计覆盖——构建全球一致且高精度的IDF曲线一直面临挑战。
以往研究多基于遥感降雨产品(如MSWEP、ERA5再分析数据)采用“自上而下”方法推求IDF曲线,但存在空间分辨率粗(如31 km)、时间不一致性以及对流过程解析不足等问题。相比之下,本研究提出一种“自下而上”的新途径,直接利用全球次小时降雨(GSDR)站点观测数据,结合随机森林回归模型,区域化Simplified Metastatistical Extreme Value(SMEV)分布的参数,进而计算任意历时(1-24小时)和重现期下的降雨强度,形成名为BURGER(Bottom Up Regionalized Global Extreme Rainfall)的数据集。
研究采用的“地面真实”降雨观测来自GSDR数据集,共使用约10,700个经过质量控制的站点,这些站点主要分布在北美、欧洲和日本。尽管GSDR数据经过严格质量控制,但小时降雨观测仍存在显著不确定性,如单点测量误差可达10%,而风力导致的捕获不足在暴露地区可能造成20%以上的低估。
2.2 简化Metastatistical极值(SMEV)方法
传统极值分布(如GEV)仅利用年最大值,而Metastatistical极值(MEV)分布利用所有独立普通事件(ordinary events),能够提高参数估计的确定性,尤其适用于短记录和次小时降雨。本研究采用其简化版本SMEV,假设普通事件服从Weibull分布,并通过功率律关系将形状和尺度参数与历时关联。
具体步骤包括:从观测中提取普通事件(事件间隔至少24小时),拟合MEV参数后进一步优化为SMEV参数,最后通过最小二乘回归建立参数与历时的缩放关系。最终,SMEV模型仅用两个独立参数(重现期和历时)即可计算降雨强度。为确保估计稳健,仅保留记录长度超过10年且风暴数量高于第5百分位数的站点。
为区域化稀疏的SMEV参数,研究采用了19种全球一致的特征数据集,包括MSWEP降水统计量(均值、最大值、变异系数、分位数)、FathomDEM高程、ERA5海平面压力和露点温度、CHELSA生物气候变量、柯本-气候分区以及纬度等。这些特征分辨率从30角秒到0.25°不等,均重采样至0.1°网格,覆盖60°S至80°N范围。
采用随机森林回归模型同时区域化所有SMEV参数。首先通过10折交叉验证网格搜索优化超参数,评估指标包括决定系数(R2)、平均绝对误差(MAE)和均方根误差(RMSE)。训练完成后,模型用于预测所有陆地区域的SMEV参数,进而计算全球IDF曲线。仅支持1-24小时历时,但可通过调整风暴分离时间扩展至更长历时。
评估包括:比较区域化与站点SMEV参数的百分比偏差(PBIAS);在剔除日本和德国站点后重新训练模型,以测试无观测区性能;与遥感衍生IDF产品GPEX和美国NOAA Atlas 14数据对比;使用结构相似性指数(SSIM)和峰值信噪比(PSNR)等图像相似性指标量化空间一致性。
随机森林模型对尺度参数和n参数(年均风暴数)预测技能较高(R2>0.68),但对shape_power参数预测较差(R2=0.48)。特征重要性分析表明,降水变异系数(CV)和纬度是最重要预测因子,而高程重要性较低,可能因其影响已在其他降水相关参数中隐含体现。
参数分布比较显示,区域化值能够较好地再现站点参数分布,但在分布尾端存在一定偏差,这是随机森林模型的常见局限。区域化参数的空间分布符合气候学预期,如高风暴频率出现在北半球和赤道地区。
在全球尺度上,BURGER强度与站点SMEV强度中值偏差约为0%,四分位范围在-5%至5%之间,但随着重现期增加,偏差范围扩大(-18%至22%)。这种偏差尤其在美国大陆(CONUS)较为明显,可能源于形状参数预测不准导致分布尾部过轻。
剔除日本和德国站点后的模拟显示,BURGER在无观测区仍能保持合理性能,中值偏差不超过±10%。日本地区性能优于德国,表明模型 extrapolation 能力存在区域差异,这与观测站分布密度和气候复杂性有关。
BURGER与GPEX强度存在显著差异,前者普遍高于后者,尤其在澳大利亚和中亚地区偏差可达200%。SSIM和PSNR值较低表明两者空间结构一致性不高,但这种差异并不因观测有无而系统性变化,说明BURGER在无观测区仍能保持与GPEX相当的一致性水平。
3.2.4 与NOAA Atlas 14数据基准对比
BURGER低估NOAA强度,对于1小时500年事件,中值绝对偏差约16 mm/h(17%)。这种差异部分源于方法学不同:NOAA使用更多站点、采用区域频率分析(RFA)和PRISM模型进行空间插值,且可能未进行相同的异常值剔除。尽管如此,BURGER强度与GSDR经验值高度一致,表明其基于观测的区域化结果具有可靠性。
BURGER是首个基于地面观测的全球次小时IDF数据集,空间分辨率达10公里,填补了全球IDF产品的空白。虽然机器学习模型在预测形状参数时表现较差,导致极端事件强度低估,但整体精度可接受(全球中值偏差0%,四分位范围±5%)。
未来改进方向包括:采用参数特异性预测因子(如遥感衍生的形状和尺度参数场)、提高空间分辨率以更好解析对流过程、增加更多次小时降雨观测、探索神经网络等替代模型以改善分布尾部预测、以及引入气候变化因子(如温度协变量)以扩展至未来气候情景。
尽管与区域IDF产品(如NOAA Atlas 14)存在差异,BURGER提供了全球一致且基于观测的IDF估计,特别适用于数据稀缺地区。这种“自下而上”方法为全球洪水风险管理和气候适应规划提供了重要工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号