基于可解释机器学习算法的多源降水产品与地表数据融合降尺度研究——以土耳其地中海地区为例
【字体:
大
中
小
】
时间:2025年09月30日
来源:Science of The Total Environment 8
编辑推荐:
本期推荐一篇融合多源降水产品(PERSIANN-CCS、CHIRPS、GSMaP、IMERG v6等)、地表数据(NDVI、LST、高程)与气象站点观测,采用可解释机器学习算法(Cubist、RF、XGBoost、LightGBM、CatBoost)进行降水降尺度研究的创新论文。研究通过SHAP(SHapley Additive exPlanations)模型解析,显著提升地中海复杂地形区0.04°高分辨率降水估算精度(PCC > 0.79,RMSE < 39 mm),为水文气候研究与灾害防控提供重要数据支撑。
研究选取土耳其南部的地中海区域作为研究区(图1),以探究Cubist、RF、XGBoost、LightGBM和CatBoost在降水数据融合与降尺度中的应用。该区域南临地中海,西接爱琴海,地形以托罗斯山脉为主,呈现复杂地形特征。
本研究使用了八种卫星与再分析降水产品,以及193个均匀分布的气象站点数据,同时整合了高程、地表温度(LST)、归一化植被指数(NDVI)和距海距离(DfS)等地表特征参数作为输入变量。
研究采用Cubist、RF、XGBoost、LightGBM和CatBoost五种算法,融合多源降水数据与地表特征,生成土耳其地中海区域的高精度降尺度降水估算结果。不同降水数据集的空间表征差异是生成与评估融合产品时需重点解决的挑战。
如第4.1节(数据准备)所述,研究使用三种降水数据集组合(含/不含地表特征,共六种组合)及单独网格产品与地表参数融合结果作为模型输入,对193个气象站点降水进行估算。鉴于ERA5_land和IMERG_land组合的优异表现,我们还单独评估了这两种组合的降尺度效果。
三种网格降水产品组合(含/不含地表特征)经重采样至0.04°后作为模型输入,用于生成降尺度降水图。Comb1包含八种空间分辨率0.25°–0.04°的卫星与再分析降水产品,观测期始于1983年;Comb2为长期观测产品(约40年);Comb3为近实时数据(约1小时延迟)。结果显示,Comb1和Comb2在统计指标和空间分布上均显著优于单一产品,而Comb3因分辨率与组分相近未体现增益。SHAP分析揭示IMERG和ERA5为最具影响力降水输入,高程与LST是主导地表特征,NDVI贡献微弱。
本研究评估了规则型机器学习算法Cubist与四种主流ML算法(RF、XGBoost、LGBM、Catboost)在土耳其地中海区域月尺度降水降尺度(0.04°)中的表现。模型使用2017–2021年月数据训练验证,通过融合八种降水产品与地面观测数据,并整合高程、NDVI、LST、距海距离等地表参数,显著提升了复杂地形区降水估算精度。SHAP可解释性分析明确了关键特征贡献,为水文气候模型提供高分辨率数据支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号