《Agricultural and Forest Meteorology》:Integrating global canopy height models with satellite data for improved forest inventory in Ukraine
编辑推荐:
研究人员针对乌克兰因持续战乱及传统清查方法受限导致 accurate forest monitoring 面临前所未有的挑战,需稳健的星载替代方案以支持国家森林清查(National Forest Inventory, NFI)业务,开展了将前沿冠层高度模型(
研究人员针对乌克兰因持续战乱及传统清查方法受限导致 accurate forest monitoring 面临前所未有的挑战,需稳健的星载替代方案以支持国家森林清查(National Forest Inventory, NFI)业务,开展了将前沿冠层高度模型(Canopy Height Model, CHM)与已配准的多传感器卫星数据相融合、旨在实现接近机载激光雷达(Light Detection and Ranging, LiDAR)精度的森林结构参数估算综合框架研究。研究人员评估了6种CHM与乌克兰NFI实测林分平均高(Stand Height)的一致性,其中Pauls等(2025)发布的欧洲尺度CHM表现最优(R2=0.68,RMSE=4.65 m)。将该CHM与光学(Sentinel-2)及雷达(Sentinel-1、ALOS PALSAR-2)观测值共同作为输入,测试20种机器学习算法构建框架,探究卫星反演冠层高度是否能提升森林结构参数估算精度,以及全国统训模型与区域特定模型之优劣。特征重要性分析显示CHM反演高度为主导预测因子(贡献度45–60%),其次为Sentinel-2短波红外(Short-Wave Infrared, SWIR)波段及植被指数。该方法对四项森林结构参数达成相对均方根误差(relative Root Mean Square Error, rRMSE)8.8–12.3%:立木蓄积量(Growing Stock Volume, GSV, R2=0.77)、胸高断面积(Basal Area, BA, R2=0.68)、林分年龄(Stand Age, R2=0.53)及胸径(Diameter at Breast Height, DBH, R2=0.48);相较不含高度信息的模型精度提升49–144%。该框架成功生成全覆盖(Wall-to-Wall)森林清查专题图且在不同森林条件下具良好可移植性,确立星载森林清查可作为全球数据匮乏区之可行替代方案。
《Integrating global canopy height models with satellite data for improved forest inventory in Ukraine》论文解读
本文发表于《Agricultural and Forest Meteorology》。乌克兰森林资源评估面临双重困境:历史上缺乏系统性的国家森林清查(National Forest Inventory, NFI)基线数据,自2021年才启动首个基于抽样之NFI周期;加之2014年起部分领土不可进入,2022年全面入侵致约20%国土因雷区与战事无法开展地面调查,传统依赖野外样圆测量和机载激光雷达(Light Detection and Ranging, LiDAR)之清查手段失效。仅靠光学遥感在高生物量林分中存在光谱信号饱和(Signal Saturation)问题,即光谱响应对蓄积量(Growing Stock Volume, GSV)进一步增加不再敏感。冠层高度系重要异速生长(Allometric)替代变量,属森林垂直结构第三维度信息,在密林多层冠层中仍保持敏感性。近年NASA全球生态系统动力学调查(Global Ecosystem Dynamics Investigation, GEDI)与ICESat-2使星载大范围冠层高度模型(Canopy Height Model, CHM)成为可能,但不同CHM产品在东欧地区之适用性、CHM融合多源卫星数据对森林参数估算之增益、全国统训模型与区域模型之权衡均有待验证。研究人员因此系统评估六种全球CHM并以最优CHM结合Sentinel-2光学、Sentinel-1 C波段与ALOS PALSAR-2 L波段雷达数据,采用机器学习框架估算乌克兰NFI四项核心结构参数,对比有无CHM及全国与区域建模效果,论证星载清查框架之可行性。
主要关键技术方法
研究人员选取乌克兰西部伊万诺-弗兰科夫斯克(Ivano-Frankivsk)州与东北部苏梅(Sumy)州为研究区,使用乌克兰NFI 2021–2023年2634个固定半径12.62 m(面积500 m2)永久样圆实测数据,获取林分平均年龄、胸径(Quadratic Mean Diameter at Breast Height, DBH≥6 cm)、物种特异性异速方程计算的每公顷立木蓄积量(Growing Stock Volume, GSV)及胸高断面积(Basal Area, BA),样圆冠层高为前五株最高树均值。从Google Earth Engine获取Sentinel-2 Level-2A 2024年夏季中值合成(9个波段+NDVI/NDII/NBR2),Sentinel-1 2024夏中值(VV/VH及比值),ALOS PALSAR-2 2023年年度镶嵌(HH/HV及比值),统一重采样至20 m并提取各样点像元值。评估六种全球CHM(Potapov et al. 2021; Lang et al. 2023; Liu et al. 2023下采样至10 m; Pauls et al. 2024; Pauls et al. 2025; Tolan et al. 2024)与NFI实测高之精度(R2、RMSE、MAE、rRMSE),选最优CHM加入预测变量集。采用Python 3.12以IQR法剔除异常值,标准化后比较20种回归算法(线性模型、树集成、XGBoost、LightGBM、鲁棒回归、kNN、MLP、SVR、高斯过程),随机搜索百次迭代+3折交叉验证优选超参,以Ridge Regression建立含CHM与不含CHM共七种特征组合模型,并分别训练全国模型(n=2621)与伊万诺-弗兰科夫斯克(n=459)、苏梅(n=114)区域模型,按最优组合以分块瓦片生成20 m分辨率全覆盖森林参数图及变异系数(Coefficient of Variation, CV)不确定性图层。
研究结果
3.1. Comparing global canopy height models against NFI reference data
研究人员将六款CHM反演冠层高与NFI样圆实测冠层高进行回归验证,Pauls et al.(2025)欧版时态卷积神经网络模型精度最高(R2=0.68,RMSE=4.65 m,MAE=3.21 m),显著优于Potapov et al.(2021)(R2=0.28,RMSE=7.58 m);六模型精度排序为Pauls et al.(2025)>Liu et al.(2023)>Lang et al.(2023)>Pauls et al.(2024)>Tolan et al.(2024)>Potapov et al.(2021)。早代模型对>30 m高林木系统性低估且残差异方差明显,较新模型在全高度区间更稳定。故后续选用Pauls et al.(2025) CHM作高度预测因子。
3.2. Feature importance analysis and predictor selection
基于随机森林(Random Forest, RF)之特征重要性分析表明,Pauls et al.(2025) CHM冠层高度贡献占45–60%,为最主要预测变量;次之为Sentinel-2短波红外(Short-Wave Infrared, SWIR)波段B12(1610 nm)与B11(2190 nm);再次为ALOS PALSAR-2 L波段交叉极化(HV)与同极化(HH)后向散射,其重要性高于Sentinel-1 C波段及多数光谱植被指数(Vegetation Index, VI)如归一化差分植被指数(Normalized Difference Vegetation Index, NDVI);可见光波段(B2、B3、B4)重要性最低。依此最终保留Sentinel-2反射率与Pauls et al.(2025) CHM构建精简预测集以降低多传感器噪声传播风险。
3.3. Machine Learning model performance and algorithm comparison
测试二十种回归算法后Ridge Regression表现最佳(整体R2=0.552,rRMSE=11.596%),线性最小二乘与贝叶斯岭(Bayesian Ridge)、Lasso结果近似(R2差异<0.001),说明引入高质量冠层高度使遥感观测与森林参数间关系趋近线性,削弱多重共线性影响;随机森林(R2=0.549)略低;XGBoost与LightGBM(R2≈0.52)反而因过拟合逊于线性模型,故最终选用Ridge Regression做参量反演。
3.4. Forest inventory parameter retrieval performance
加入Pauls et al.(2025) CHM之Ridge模型较无CHM基线对各参数R2显著提升——立木蓄积量GSV由0.36升至0.64(+78%),胸高断面积BA由0.35升至0.52(+49%),林分年龄(Age)由0.24升至0.49(+104%),胸径(DBH)由0.18升至0.44(+144%)。全国统训模型结果为GSV(R2=0.77,RMSE=86.13 m3/ha,rRMSE=8.8%)、BA(R2=0.68,RMSE=7.40 m2/ha,rRMSE=9.9%)、Age(R2=0.53,RMSE=17.17 yr,rRMSE=11.5%)、DBH(R2=0.48,RMSE=8.25 cm,rRMSE=12.3%)。区域模型方面,苏梅局部模型虽仅114个样圆,但因林区均质度高,Age(R2=0.71)、DBH(R2=0.81)、GSV(R2=0.79)、BA(R2=0.70)均等于或优于全国模型;伊万诺-弗兰科夫斯克山地林区局部模型Age(R2=0.59)与DBH(R2=0.64)改善,但GSV与BA略降,反映异速生长关系在不同生境之差异。
3.5. Spatial mapping and regional model comparison
按最优组合生成20 m分辨率逐像元GSV反演图及CV不确定性图层,伊万诺-弗兰科夫斯克山区成熟针叶林GSV高值区与已知分布吻合,苏梅呈现混交林与农地镶嵌之异质性格局;核心林区CV多介于10–30%,林缘与地形复杂区>40%。直方图显示伊万诺-弗兰科夫斯克GSV分布宽(峰值高且有>400 m3/ha),苏梅呈低值偏态(众值50–100 m3/ha)。像素比对示全国模型在伊万诺-弗兰科夫斯克成熟林龄低估10–20年、大径级DBH低估,区域模型减小散点并消除偏差;苏梅全局模型存异方差误差随参数值增大而放大,局部模型全值域一致性好,印证区域校准对年龄—直径关系之重要性,而蓄积量异速换算受区域差异影响较小。
讨论与结论翻译总结
讨论指出Pauls et al.(2025)优于早前产品得益于卷积神经网络(Convolutional Neural Network, CNN)利用空间纹理上下文及10 m分辨率匹配冠幅尺度,且引入Sentinel-2时序滤波物候噪声;甚高分辨率(1–3 m)模型因缺SWIR波段及NFI样圆尺度内高频噪声反而未胜出。线性模型最优说明优质高度信息线性化关系,CHM高度为主预测因子、SWIR次之、L波段雷达强于NDVI。局部模型对年龄与DBH改善明显,全国模型便于可扩展上报,实践中可采用CHM作基底+有地面数据时区域校正之混合策略。CV图层可指导野外抽检重点。方法局限含>~35 m高度饱和、20 m混合像元效应及卫星—野外测年时间失配(<2% rRMSE差异可忽略),精度满足战略与战术森林规划容差。此框架为战火致不可达区提供唯一可行NFI替代途径,支持国家报告(IPCC、FAO FRA、EU LULUCF)与战后重建决策。
研究结论:本研究表明整合全球冠层高度模型(Canopy Height Model, CHM)与已配准光学及雷达卫星数据可克服国家森林监测中结构性数据缺口并实现业务化运行。系统评估六种CHM后确认时态卷积神经网络方法Pauls et al.(2025)为最精确结构预测因子。特征重要性分析证实反演冠层高度主导多光谱与后向散射信号,有效线性化遥感观测与森林清查参数关系,因此正则化线性算法如Ridge Regression达最优预测性能,较仅用光谱数据模型显著提升。尽管全国尺度框架提供稳健全覆盖基线,区域模型校准可明显改善参数反演精度,凸显捕捉区域特异性异速关系的重要性。该途径建立了可扩展之星载森林清查框架,能在数据稀缺或地面不可达环境中提供关键森林结构参数。