基于SMOS观测与SMAP时代同化建模的全球无缝日尺度土壤水分数据集(2010–2015)构建与验证

《International Journal of Digital Earth》:A seamless global daily soil moisture dataset (2010–2015) harmonized from SMOS observations and SMAP-era assimilation modeling

【字体: 时间:2026年01月01日 来源:International Journal of Digital Earth 4.9

编辑推荐:

  本推荐旨在介绍一项创新性研究,该研究成功构建了一个覆盖2010至2015年的全球无缝日尺度土壤水分数据集(ESSM)。研究通过整合SMOS亮度温度(Tb)观测与SMAP时代同化产品(SPL4),采用数据插值经验正交函数(DINEOF)填补SMOS Tb空缺,并利用结构灵活的长短期记忆网络(sf-LSTM)分生物气候区训练模型,最终通过主成分分析-小波(PCA-wavelet)融合方法结合Copernicus(C3S)数据优化产品一致性。验证显示ESSM精度高(ubRMSE中位数=0.04 m3/m3),优于现有基准数据集,为水文建模、干旱监测及气候变化研究提供了重要数据支撑。

  
引言
土壤水分是地球水循环和能量循环中的关键变量,对水文、农业和气候过程具有重要影响。监测土壤水分的方法主要分为三类:局部尺度的原位传感器、中间尺度的宇宙射线中子传感(CRNS)技术,以及最广尺度的卫星遥感。其中,微波遥感,特别是L波段(~1.4 GHz)的观测,因其对水分变化的高敏感性、对植被和云层的穿透能力以及较少受恶劣天气影响的特点,已成为近全球表层土壤水分(0–5 cm)监测的主要手段。
欧洲空间局(ESA)的土壤水分和海洋盐度(SMOS)任务(始于2009年)和美国国家航空航天局(NASA)的土壤水分主动被动(SMAP)任务(始于2015年)是专为土壤水分观测设计的连续L波段卫星任务。SMAP Level-4(SPL4)产品通过将SMAP亮度温度(Tb)同化到NASA集水区地表模型(NASA-CLSM)中,提供了偏差校正后的、时空连续的土壤水分估计。然而,SMOS和SMAP任务之间存在时间间隙,且SPL4产品的时间范围有限,制约了长期应用。SMOS平台虽然时空分辨率较低且更易受射频干扰(RFI)影响,但其自2010年开始运行,提供了比SMAP更长的观测档案,对于研究土壤水分的长期趋势和变率具有独特价值。
近年来,机器学习技术的发展使得利用多源Tb数据建模复杂的非线性关系以生成更长时序的土壤水分记录成为可能。已有研究尝试通过桥接不同卫星的亮度温度记录来扩展土壤水分数据集,但数据质量不一致、时间域存在间隙以及多波段反演的复杂性等问题依然存在。本研究旨在通过整合SMOS和SMAP的多源L波段被动微波数据,并辅以静态辅助数据集,生成无缝、时空连续的土壤水分产品,以协调SMAP与SMOS的时间覆盖范围,同时保持一致的空间分辨率。
材料与方法
本研究使用的数据包括SMAP Level-4表面土壤水分产品(SPL4,2015年3月至2019年12月)、SMOS Level-3亮度温度产品(SMOS_L3 Tb,V极化,2010年至2020年)以及Copernicus气候变化服务土壤水分复合产品(C3S-SM)。此外,还引入了两个典型的Tb反演重建土壤水分数据集——无缝全球日尺度AMSR2土壤水分(SGD-SM)和长期全球日尺度土壤水分数据集(NNsm)用于对比验证。地面验证数据来自国际土壤水分网络(ISMN)的18个监测网络(共计1064个站点)。全球环境分层(GEnS)框架被用于划分六个生物气候区,以支持分区建模。
研究方法流程主要包括五个模块:数据预处理、SMOS Tb重建、结构灵活LSTM(sf-LSTM)模型训练、基于PCA-小波的多源数据融合以及性能评估。
首先,使用数据插值经验正交函数(DINEOF)方法对SMOS Tb观测中的缺失值进行重建。DINEOF基于经验正交函数(EOF)框架,通过奇异值分解(SVD)识别数据的主要时空模态,并迭代地估计缺失值,从而生成物理一致的连续Tb记录。
其次,构建了结构灵活的长短期记忆网络(sf-LSTM)模型。该模型的架构(单层或双层LSTM)通过贝叶斯超参数优化自适应确定,以适应不同生物气候区的数据量和复杂性。输入特征包括重建后的SMOS Tb、日期(一年中的第几天,DOY)以及空间坐标(纬度和经度)。模型在SPL4土壤水分与重建Tb等特征重叠的时期(2015-2019)进行训练,然后用于预测非重叠年份(2010-2015)的土壤水分。
然后,采用主成分分析-小波(PCA-wavelet)融合框架对LSTM预测的土壤水分与C3S-SM数据集进行后处理。首先对两种土壤水分时间序列进行PCA降维,然后应用四级离散小波变换(DWT,使用Haar小波)将主成分分解为不同时间尺度的近似和细节系数。在线性融合阶段,为LSTM预测系数分配权重α(经敏感性分析确定为0.8),为C3S参考系数分配权重(1-α)。最后通过逆小波变换重建得到最终的融合产品,即扩展无缝土壤水分(ESSM)数据集。
性能评估采用皮尔逊相关系数(R)、无偏均方根误差(ubRMSE)和偏差(Bias)三个指标, against ISMN原位观测数据。
结果
整体模型验证表明,ESSM与SPL4表面土壤水分在测试期(2015年3月31日至12月31日)内表现出良好的空间一致性。有效SPL3土壤水分检索(作为Tb输入可用性的代理)百分比高的区域(如美国中部、欧洲中部和中亚部分地区),ESSM与SPL4的相关性(R)通常大于0.6。误差图显示,ESSM在大多数大陆地区的ubRMSE较低(0.00–0.05 m3/m3),但在高纬度、干旱和茂密热带森林等环境挑战性区域,误差有所增加,这反映了融合方法与同化方法在不同环境条件下的性能差异。
与多卫星合并的C3S产品以及SPL4的视觉对比显示,三者具有一致的全球空间模式,但C3S-SM表现出最强的空间变异性和动态时序行为,ESSM具有中等特征,而SPL4则显示出相对保守的估计和最小的日际波动。
针对完整ISMN观测的验证表明,ESSM与地面测量值保持了较强的一致性,网络间中位数值约为R=0.66,ubRMSE=0.05 m3/m3,Bias=-0.05 m3/m3,总体呈干偏趋势。在环境相对均一、植被稀疏的网络(如美国的SOILSCAPE和ARM、澳大利亚的OZNET、西非的AMMA-CATCH),ESSM表现最佳(中位R > 0.7, ubRMSE ~ 0.04 m3/m3)。而在站点异质性高或环境复杂的网络(如法国的SMOSMANIA、美国的SCAN和SNOTEL、青藏高原的MAQU),性能指标离散度较大。
按气候带分层统计显示,温带地区性能最优(中位R=0.67,ubRMSE=0.05 m3/m3,Bias=-0.02 m3/m3),干旱区次之,寒带地区相关性较低但随机误差与温带区相当,热带地区性能最弱且最分散,这主要与植被衰减、频繁降雨和高大气水汽含量有关。
跨越多地点的时序图验证进一步证实了ESSM在不同土地覆盖类型(农田、林地、草地)下的模拟能力,其在植被稀疏的站点(如DAHRA、Tonzi Ranch)相关性高(R > 0.8),而在植被茂密或环境复杂的站点(如VAS MelbexII、SWEX_POLAND)相关性较低。
与竞争性扩展产品(SGD-SM和NNsm)的比较表明,ESSM在大多数ISMN网络上实现了更低的ubRMSE和更小的系统偏差,特别是在观测稀疏或地形复杂的区域,其精度优势更为明显,能够更好地满足高级土壤水分卫星任务的设计精度要求。
讨论
本研究提出的全球时空扩展框架在保持遥感土壤水分观测精度和增强时空一致性方面展现出巨大潜力。ESSM产品为水文和环境研究中对可靠长期数据日益增长的需求提供了有价值的参考。
对SMOSMANIA网络验证指标的高度离散性进行了深入分析,发现其与土壤质地密切相关。ESSM在中等质地土壤(粘土含量约20–30%,砂土含量约40–60%)中表现最佳,而在极端质地(过高粘土或砂土含量)下性能下降,这与L波段土壤水分产品普遍存在的介电非线性和地表粗糙度敏感性挑战一致。
气候和环境变率,特别是青藏高原独特的冻融循环、多年冻土和高海拔条件,显著增加了土壤水分动态的复杂性,也影响了各数据产品在该区域的性能。SMOS在MAQU网络存在的强烈射频干扰(RFI)、SPL4同化系统缺乏多年冻土模块、以及C3S产品因多卫星过境时间不同步引起的时间匹配误差,都是导致该区域不确定性增加的因素。
与ISMN密集网络原位数据对比所观察到的差异,主要源于点尺度测量与像元尺度遥感数据空间代表性的不匹配,特别是在异质性景观区域。时间动态的差异,如遥感观测频率与土壤水分关键变化事件(如降水)的不完全同步,也降低了数据集之间的一致性。
本研究框架原则上可推广到任何拥有足够Tb观测的时期。然而,2010年之前的Tb源主要来自更高频的微波仪器(如AMSR-E/2, C/X波段)或散射计(如ERS-1/2, ASCAT),其土壤穿透深度更浅,对植被和地表粗糙度的依赖性更强,需要进行仔细的跨波段校准。热红外观测(如AVHRR)虽能提供更长时间序列,但捕获的是地表辐射温度而非介电特性,需通过敏感性映射和时序调整才能作为补充输入。
研究也认识到工作流每个阶段可能引入的误差。DINEOF方法假设主导EOF模态时空平稳,这在存在强烈非平稳性的区域(如冻融过渡、突发降水事件)可能不成立,可能导致重建场缺乏真实的时空变率。虽然随后的sf-LSTM模型有望缓解部分噪声影响,但未来研究需明确量化与此类数据重建方法相关的误差传播和变率。此外,尽管sf-LSTM架构支持跨生物气候区的自适应学习,但验证结果表明空间泛化能力仍受地表异质性制约。当前的多阶段重建框架计算需求量大,未来发展方向包括集成注意力机制和景观感知特征嵌入以增强适应性,以及结合代理建模方法来降低计算成本。
结论
本研究提出了一个时空扩展框架,通过整合SMOS和SMAP任务的多源L波段被动微波观测,生成无缝的全球土壤水分产品。该框架通过DINEOF-based Tb重建、sf-LSTM土壤水分预测以及与C3S数据集的后期融合处理,协调了SMAP与SMOS的时间覆盖范围,实现了0.25°的一致空间分辨率,并扩展了2010–2015年的覆盖期,以支持连贯的长期土壤水分分析。
针对全球18个ISMN网络(超过1000个站点)的验证表明,其性能强劲,全球ubRMSE中位数约为0.04 m3/m3,相关性(R)中位数约为0.6,达到了SMAP任务的设计精度要求。按气候带划分,ESSM在温带地区表现最佳(R=0.67;ubRMSE=0.05 m3/m3;Bias=-0.02 m3/m3),并在干旱、寒带和热带地区保持物理一致性。在土地覆盖层面,ESSM能捕捉农田、草地和林地表面的真实土壤水分变率,在开阔、低植被区域达到R > 0.8,并在较密冠层条件下保持稳定性能。
与现有的长期重建数据集(SGD-SM和NNsm)相比,ESSM实现了低15–25%的ubRMSE和更小的系统偏差,特别是在观测稀疏或地形复杂的区域。总体而言,ESSM在SMAP前期再现了SMAP级别的反演精度,增强了时间连续性和物理真实性,为水文建模、干旱与热浪监测以及气候变率评估提供了稳健的基础。所提出的框架也展示了未来在多传感器融合和长期地球系统再分析方面的强大潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号