《Scientific African》:Benchmarking data fusion approaches for enhanced soil moisture mapping over Africa using GNSS-R
编辑推荐:
摘要:本文通过将十四层无云地球物理图层与Cyclone Global Navigation Satellite System(CYGNSS)Level?1反射率(reflectivity)融合,以预测CYGNSS Level?3土壤湿度(soil moistu
摘要:本文通过将十四层无云地球物理图层与Cyclone Global Navigation Satellite System(CYGNSS)Level?1反射率(reflectivity)融合,以预测CYGNSS Level?3土壤湿度(soil moisture)反演值,并生成非洲地区1 km分辨率月度土壤湿度分布图。研究采用2020年1月和6月经质量筛选的240万个Level?1足迹(footprint)数据,使用分组交叉验证(block?wise cross?validation)策略训练随机森林(Random Forest,RF)、极端梯度提升(eXtreme Gradient Boosting,XGBoost)和一维卷积神经网络(1?D Convolutional Neural Network,CNN)模型;除CYGNSS观测值和所述辅助地球物理图层外未引入其他数据。以CYGNSS Level?3反演值为参照,集成模型对目标Level?3场再现的决定系数(Coefficient of Determination,R2≥ 0.94)、均方根误差(Root Mean Square Error,RMSE ≤ 0.022 m3/m3),且无需季节性重训练。极端梯度提升(XGBoost)使RMSE降低5–10%,但差异处于Level?3反演不确定度范围内。特征分析表明归一化植被指数(Normalized Difference Vegetation Index,NDVI)贡献最大(约70%),当植被–土壤耦合被编码后,Level?1反射率贡献不超过6%。生成的1 km分辨率1月和6月分布图可分辨亚SMAP(Soil Moisture Active Passive)尺度的水文特征——赞比西河与尼日尔河洪泛区指状水系、奥卡万戈湿地及刚果盆地5–10 km林间空地,并捕捉到赤道辐合带(Intertropical Convergence Zone,ITCZ)驱动的湿度季节变化(由1月干季相位至6月季风爆发)。
论文解读:利用GNSS-R融合方法增强非洲土壤湿度制图的基准研究——基于CYGNSS数据
研究背景方面,表层土壤湿度(surface soil moisture,通常指地表0–5 cm体积含水量,volumetric soil moisture,单位m3/m3)调控可用能量向潜热与感热的分配,调制行星边界层深度、蒸散及植被生产力,对非洲干旱早期预警、精量灌溉调度、洪水预报、数值天气预报及气候变化影响评估不可或缺。地面监测网(如US-SCAN、ISMN)精度好但密度低、维护成本高,难以大陆尺度应用。被动L波段传感器SMAP(Soil Moisture Active Passive)和SMOS(Soil Moisture and Ocean Salinity)提供约36 km分辨率产品,C波段散射计ASCAT分辨率>25 km,二者均平滑掉非洲农业生态区触发闪旱的1–10 km异质性,且在密植被和复杂地形区信号衰减造成数据空缺。全球导航卫星系统反射测量(Global Navigation Satellite System Reflectometry,GNSS-R)利用L波段导航信号地表反射功率与介电常数线性关系反演土壤湿度,NASA CYGNSS(Cyclone Global Navigation Satellite System)星座在±35–38°纬度内提供0.5–7 km足迹的L波段双站雷达截面(normalized bistatic radar cross section,σ0,即reflectivity)。现有CYGNSS降尺度多依赖Sentinel-1 SAR或有云干扰的光学影像,机器学习应用于CYGNSS多局限于区域验证,且CYGNSS反射率相对辅助植被/地形数据的独立信息贡献未量化。为此,研究人员采用仅含14个全球可获取、无云干扰的辅助地球物理变量与CYGNSS Level-1反射率融合,以CYGNSS Level-3土壤湿度为参照开展非洲全境机器学习基准 downscaling 研究。
关键技术方法:研究人员选取非洲全域(35°S–37°N,20°W–55°E)为研究区,使用2020年1月和6月NASA CYGNSS Level-1 v3.1反射率数据与CYGNSS Level-3 v2.1土壤湿度(36 km)分别作预测变量与训练目标。辅助协变量含14层:MODIS NDVI(MOD13A1)、经纬度(CYGNSS元数据)、CYGNSS反射率、SRTM v3高程与坡度、日序分数(day fraction)、SMAP辅助静态地表粗糙度、方位角、入射角(theta)与镜面入射角(sp_inc_angle)、JRC全球地表水水体占比、SoilGrids 250 m砂粒与黏粒体积分数,统一重采样至0.01°(约1 km)WGS-84网格。CYGNSS原始足迹经质量控制(质量标志=0、反射率为正、水体分数<0.1、在非洲范围内、无缺失值)后获得约238万个样本。随机选取6万个点训练三种非参数回归模型——随机森林(RF,15棵树、最大深度9)、极端梯度提升(XGBoost,60棵、最大深度6、学习率0.1)及一维卷积神经网络(1-D CNN,两卷积块+池化+Dropout+全连接),采用随机90%/10%划分验证集计算R2与RMSE,无空间分块交叉验证及地面站独立验证,逐日预测经NearestNDInterpolator插值至规则网格并掩膜距最近观测>50 km格点,按月合成得到1 km土壤湿度分布图,通过特征重要性分析量化各变量贡献。
研究结果如下:
CYGNSS Surface Reflectivity Map(CYGNSS地表反射率分布图):将2020年1月与6月CYGNSS Level-1反射率镶嵌显示,1月呈明显南北梯度——撒哈拉北非为高反射率(矿物表面相干反射),向南至萨赫勒减弱,刚果盆地雨林为低反射率(L波段吸收与去极化);6月ITCZ北移,西萨赫勒因植被枯落与表土干燥反射率升高3–5 dB,南非高原也有2–4 dB亮化,刚果核心区持续低反射率,并可分辨刚果盆地10–15 km clearing亮斑及乌班吉–刚果河洪水亮带,证明CYGNSS反射率编码植被物候、土壤湿度及短时水文事件。
SMAP Soil Moisture Map(SMAP土壤湿度分布图):SMAP Level-3产品显示非洲北部 hyper-arid 区<0.10 m3/m3,刚果盆地等地>0.30 m3/m3,赞比西洪泛区与奥卡万戈湿地现湿指状异常,与CYGNSS产品相关性r > 0.85。
CYGNSS Soil Moisture Level-3(CYGNSS Level-3土壤湿度分布图):CYGNSS L3产品1月马格里布与尼罗河谷<0.10 m3/m3、刚果–乌干达雨林0.50–0.60 m3/m3、卡拉哈里0.10–0.20 m3/m3;6月ITCZ北移使西萨赫勒增约0.05 m3/m3,博茨瓦纳等地偶现绿斑,赤道核心持续湿润。
Soil Moisture Prediction Accuracy(土壤湿度预测精度):三个模型对1月与6月CYGNSS L3的测试集R2均>0.91,XGBoost最优——1月R2=0.952、RMSE=0.0223 m3/m3,RF为R2=0.941、RMSE=0.0247 m3/m3,CNN为R2=0.918、RMSE=0.0291 m3/m3;6月XGBoost R2=0.955、RMSE=0.0193 m3/m3,RF R2=0.944、RMSE=0.0214 m3/m3,CNN R2=0.910、RMSE=0.0272 m3/m3。6月略优可能源于ITCZ北移后训练域湿度更均匀。模型排序稳定:XGBoost > RF > 1-D CNN。
Spatial Distribution of Predicted Soil Moisture(预测土壤湿度的空间分布):RF、XGBoost和CNN生成的1 km月度图均捕捉ITCZ季节位移——1月湿区集中于10°S–5°N赤道雨林(最高≈0.50 m3/m3),撒哈拉近零,萨赫勒0.2–0.3 m3/m3,尼日尔河洪泛平原与乍得湖湿地可辨;6月湿核心仍在刚果,萨赫勒中间态,撒哈拉持续干,XGBoost较RF与CNN更好保留撒哈拉微干异常及细尺度湿地特征,CNN细部略模糊。
Feature Importance Analysis(特征重要性分析):NDVI占绝对主导(1月≈70%,6月升至72%–74%),经纬度和(≈10% 1月、≈8% 6月)次之,高程、日序、CYGNSS反射率各自≈5%(反射率≤6%),地表粗糙度/坡度/方位角/入射角合计≈10%,水体分数/砂粒/黏粒分数各≈5%。说明NDVI在月尺度整合了根区水分与降雨季节性的耦合信号,L波段反射率在植被–土壤耦合已被编码后未提供显著额外独立信息。
Spatial Error Mapping(空间误差分布图):以预测值与CYGNSS L3之差绘制的空间误差图显示误差随景观水文条件、植被覆盖与地形波动,与整体定量指标互补,永久淹水区(尼日尔内陆三角洲、苏德湿地)存正偏差(+0.04±0.02 m3/m3),尼罗河谷灌溉密集区略低估。
讨论与结论翻译:研究人员指出NDVI主导(~70%)符合非洲植被物候整合根区水分的生态水文框架,且干湿季特征重要性层级稳定不同于温带区;RMSE 0.019–0.022 m3/m3接近SMAP任务目标(0.04 m3/m3)而空间分辨率提高36倍(1 km vs 36 km),可分辨赞比西河中段(4–8 km)与尼日尔河内陆三角洲(6–12 km)等亚SMAP特征;永久淹水区正偏差及密植冠层下低估属L波段物理局限而非模型缺陷;六小时处理延迟满足业务干旱预警需求,MODIS NDVI的16天合成引入时间失配,业务运行宜换用近实时植被指数或引入滞后项建模。局限含以CYGNSS L3作参照属降尺度而非独立地面验证、1 km未完全达田块尺度异质性、弃用Sentinel-1损失粗糙纹理信息。结论:本研究首次建立非洲全水文气候梯度下基于机器学习的GNSS-R数据融合土壤湿度反演大陆尺度基准——融合CYGNSS Level-1反射率与14层无云地球物理图层,简约集成模型在1 km分辨率达R2≥ 0.94、RMSE ≤ 0.022 m3/m3且无需季节性重训练;XGBoost略优于RF与1-D CNN,三者均能分辨亚SMAP水文特征并捕捉ITCZ季节迁移;NDVI为最主要预测因子(~70%),辅助地球物理层编码植被–土壤耦合使模型有效利用GNSS-R信号;未来需开展ISMN地面站与SMAP增强产品独立验证、纳入灌溉掩膜与改进介电混合模型校正淹水/密植偏差、在有数据时堆叠Sentinel-1 SAR及改用近实时植被指数匹配CYGNSS重访能力。该研究证明仅凭GNSS-R与全球可用地球物理层即可生成公里级全天候土壤湿度产品,为数据稀疏热带地区水文监测提供可扩展低延迟框架。论文发表于《Scientific African》。