基于再分析数据与人工智能的台湾区域蒸发量估算框架研究
《Journal of Hydrology: Regional Studies》:Reanalysis-assisted AI framework for regional pan evaporation estimation in Taiwan without ground-based meteorological observations
【字体:
大
中
小
】
时间:2025年10月19日
来源:Journal of Hydrology: Regional Studies 4.7
编辑推荐:
本研究针对台湾地区A级蒸发皿分布稀疏、地面气象观测数据不足的问题,开发了一种结合高分辨率再分析数据(TReAD)与人工智能模型(XGBoost等)的框架,用于无地面气象观测资料地区的日蒸发量(Epan)估算。通过留一站交叉验证(LOSO-CV)评估,XGBoost模型表现最优(MAE=0.92 mm/day, KGE=0.58),并结合SHAP分析揭示了太阳辐射、温度、湿度等关键驱动因子及降水、季节周期等隐藏影响。该研究为复杂地形下蒸发量的空间连续估算提供了可靠方法,对农业水资源管理、水库调度及气候适应具有重要实践意义。
在东亚的亚热带岛屿台湾,复杂的地形和多样的气候条件使得水文过程研究充满挑战。蒸发是水文循环的关键组成部分,准确估算蒸发对于农业灌溉需求、水资源管理以及气候影响评估至关重要。在实际水文业务中,A级蒸发皿(Class A pan)测量的蒸发量(Epan)被广泛用作大气蒸发需求的实用指标。然而,直接测量虽然可靠,但其空间覆盖范围受到高昂的安装和维护成本、仪器故障、环境干扰以及不一致的长期记录等问题的严重限制。特别是在偏远和山区,建立和维护观测站面临巨大挑战,导致显著的空间和时间数据空白。
为了弥补缺失或稀疏的Epan观测数据,蒸发通常通过参考蒸散量(ET0)模型进行间接估算,例如基于物理过程的Penman-Monteith方程、简化的Priestley-Taylor方法以及基于温度的经验公式如Hargreaves-Samani。虽然这些方法对于ET0估算是有效的,但Epan通常通过使用A级蒸发皿的直接测量或通过经验推导的蒸发皿系数(Kp)转换ET0来获得。这种转换过程由于当地气候和特定地点因素而引入了不确定性,特别是在地形异质性或观测网络稀疏的地区。此外,ET0和Epan对太阳辐射(SR)、相对湿度(RH)和平均风速(Um)等气象变量的敏感性不同,这限制了间接估算的准确性。
随着计算资源的进步,人工智能技术(AI)——包括机器学习(ML)和深度学习——已成为直接从气象变量估算Epan的强大工具,避免了中间ET0计算和Kp转换。研究表明,基于AI的技术在估算Epan方面表现出优越的性能,即使在数据可用性有限的情况下也是如此。除了蒸发,AI方法已被应用于重建缺失的水文气象变量,如降雨、温度和径流,突出了它们在数据稀缺环境中的潜力。
尽管取得了这些进展,但大多数现有的基于AI的Epan研究都是在空间均质的区域内进行训练和评估的,严重依赖通常分布不均且不完整的地面站点数据。因此,它们对无测站位置——特别是在具有显著气候和地形异质性的地区——的泛化能力在很大程度上仍未得到检验。很少有研究使用独立的空间验证来系统评估AI模型在不同气候区蒸发估算的性能。这一空白对于像台湾这样的地区尤其关键,那里陡峭的海拔梯度、复杂的季风动力学和局地微气候对蒸发的空间插值提出了重大挑战。
高分辨率气候再分析数据集为这些局限性提供了一个有前景的解决方案。诸如ERA5-Land、MERRA-2和JRA-55等产品已越来越多地用于蒸散估算和干旱监测。在台湾,由台湾气候变化推估与信息平台(TCCIP)开发的台湾再分析降尺度数据集(TReAD)提供了精细空间分辨率(2公里)的连续、高分辨率历史气候信息,即使在数据稀缺地区也能实现模型应用。这些数据已成功应用于洪水风险评估、气候灾害制图和水文建模,证明了其在环境应用中的可靠性。
然而,尽管有高分辨率再分析数据集及其在相关水文研究中的成功应用,有限的研究专注于在台湾使用此类数据集进行Epan估算,特别是在无测站条件下。为填补这一空白,本研究旨在开发和评估一个基于AI的框架,该框架将TReAD再分析数据与有限的地面Epan观测相结合,以实现全台湾范围内的空间连续和可解释的估算。
为了回答上述问题,研究人员开展了一项系统性的研究,其关键技术方法主要包括:利用台湾中央气象署(CWA)18个A级蒸发皿站点2020-2023年的日蒸发观测数据作为目标值;采用台湾再分析降尺度数据集(TReAD)提供的高分辨率(2公里)网格化气象变量(包括太阳辐射、温度、湿度、风速、气压和降水)以及站点空间元数据(经纬度、海拔)和时序信息(年积日,DOY)作为模型输入;构建并比较了五种人工智能模型——多层感知器(MLP)、支持向量回归(SVR)、随机森林(RF)、极端梯度提升(XGBoost)和门控循环单元(GRU);采用留一站交叉验证(LOSO-CV)策略严格评估模型在无测站位置的空间泛化能力;使用平均绝对误差(MAE)、均方根误差(RMSE)、相关系数(CC)、纳什-萨克利夫效率系数(CE)、克林-古普塔效率系数(KGE)等多种统计指标进行模型性能评估;并利用SHapley加性解释(SHAP)分析模型的可解释性,揭示关键气象驱动因子。
通过皮尔逊相关性分析发现,太阳辐射(SR)与Epan呈最强正相关(r = 0.66),表明其是蒸发过程的主要能量来源。温度相关变量(Tmean, Tmax, Tmin)也呈现中等正相关(r ≈ 0.55-0.58)。相对湿度(RH)与Epan呈负相关(r = -0.41),风速(Um)相关性较弱(r = 0.10)。海拔(Elev)与Epan呈负相关(r = -0.29),并与气压(P)高度负相关(r = -0.99),体现了地形气候效应。值得注意的是,尽管单站尺度上气压与蒸发常呈反比,但跨站点的空间聚合分析显示为正相关,这主要是由于高海拔站点同时具有低气压和低蒸发(受低温、低辐射影响)所致。
模型比较结果显示,XGBoost模型在留一站交叉验证中取得了最佳的综合性能,其MAE为0.92 mm/day,RMSE为1.19 mm/day,CC为0.72,CE为0.50,KGE为0.58,PBIAS为1.30%。随机森林(RF)也表现出色。而MLP模型性能相对较弱。对XGBoost模型的分站验证表明,大多数站点的KGE在0.45至0.77之间,表明模型具有稳健的估算能力。例如,位于北部的站点群(如466920、466940)由于地理邻近、气候相似,模型泛化性能良好。然而,对于海拔最高(3845米)的玉山站(467550),由于训练集中缺乏类似高海拔样本,模型外推能力受限,KGE仅为0.22,揭示了模型在极端地形条件下的估算挑战。
SHAP分析揭示了XGBoost模型决策的关键驱动因子。太阳辐射(SR)、平均温度(Tmean)、最高温度(Tmax)和风速(Um)是正向贡献最大的变量。相对湿度(RH)则显示负向贡献,符合其抑制蒸发的物理机制。值得注意的是,降水量(Pr)和年积日(DOY)也显示出显著影响力,尽管其与Epan的线性相关性较弱。这表明AI模型能够捕捉到线性相关分析无法揭示的非线性效应和隐藏影响因素,例如降水事件对蒸发的抑制以及季节循环的内在模式。
以台湾南部农业区为例,选取2023年7月1日(夏季)和2022年11月15日(秋季)两天进行案例研究。该区域仅有两个蒸发观测站,传统插值方法难以刻画空间变异。应用训练好的XGBoost模型结合TReAD网格数据,生成了全区域日Epan空间分布图。结果显示,夏季沿海低地蒸发量较高,而东部山区由于海拔高、温度低、辐射弱、湿度大,蒸发量较低,空间格局符合物理规律。秋季案例则整体蒸发量显著低于夏季,体现了模型对季节变化的捕捉能力。案例证实了该框架在数据稀疏地区生成空间连续、物理意义合理的蒸发估算图的能力。
本研究成功开发并验证了一个集成高分辨率再分析数据与人工智能模型的框架,用于解决台湾地区因A级蒸发皿分布稀疏导致的蒸发量空间连续估算难题。研究表明,TReAD数据集能有效反映台湾地理和海拔引起的气候变异,是可靠的模型输入。在比较的AI模型中,XGBoost展现出最优的空间泛化性能。通过SHAP分析,不仅确认了太阳辐射、温度、湿度、风速等主要气象驱动因子,还揭示了降水和季节周期等隐藏影响因素,提升了模型的可解释性。
该研究的创新之处在于将稀疏的地面蒸发记录与网格化再分析数据相融合,通过严谨的留一站交叉验证和可解释AI技术,实现了从点观测到区域尺度的可靠推估,并揭示了超越传统线性分析的复杂驱动机制。这一框架为缺乏地面气象观测资料地区的蒸发估算提供了实用解决方案,尤其适用于地形复杂的区域。
研究成果对台湾及其它类似地区的农业用水管理、水库优化运行以及气候变化适应规划具有重要的实际应用价值。通过提供空间连续且可解释的蒸发估算,该研究有助于更精确地评估区域水资源供需,提升水资源管理决策的科学性。
未来的研究可考虑扩充高海拔等气候敏感区的观测数据以改善模型性能,整合长期气候情景以评估气候变化对蒸发的影响,并测试该框架在不同气候区的迁移适用性,从而进一步提升其鲁棒性和普适性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号