基于混合估计器的缺失数据遥感在森林资源调查中的应用研究

《Forest Ecosystems》:Leveraging missing-data remote sensing for forest inventory

【字体: 时间:2025年10月31日 来源:Forest Ecosystems 4.4

编辑推荐:

  本研究针对遥感辅助森林调查中缺失值导致的系统性偏差问题,提出了利用混合估计器处理Landsat 7 ETM+ SLC-off缺失数据的创新方法。通过蒙特卡洛模拟与Sentinel-2完整数据对比,证明混合估计器采样精度超过90%,达到中国国家森林清查标准,且模型参数估计的不确定性可通过增加训练样本量有效控制。该研究为缺陷遥感数据在森林碳储量评估和气候变化应对策略中的应用提供了可靠解决方案。

  
在当今全球气候变化背景下,森林作为重要的碳汇生态系统,其资源监测和精准评估显得尤为关键。遥感技术凭借其大范围、高效率的优势,已成为现代森林资源调查不可或缺的工具。然而,遥感数据在实际应用中常面临各种缺陷,其中数据缺失问题尤为突出。以2003年扫描行校正器(SLC)失效的Landsat 7 ETM+传感器为例,其产生的楔形数据缺失区域约占每个场景的22%,严重影响了遥感数据的完整性,给森林生物量估算和碳储量评估等应用带来巨大挑战。
传统处理缺失数据的方法主要依赖于各种插值技术,但这些方法存在明显局限性:一方面需要时空匹配的参考影像,获取难度大;另一方面,插值过程引入的误差难以量化,最终会导致森林属性估计产生偏差。更重要的是,在历史数据应用中(如2015年前的数据),往往缺乏合适的参考影像进行插值修复。这些限制严重制约了缺陷遥感数据在森林资源调查中的有效应用。
为解决这一难题,北京林业大学的研究团队在《Forest Ecosystems》上发表了一项创新性研究。该研究首次系统性地将混合估计器(Hybrid Estimator)应用于处理Landsat 7 ETM+ SLC-off缺失数据,并与传统模型基础估计器(CMB)使用完整Sentinel-2数据的结果进行对比验证。
研究团队采用了一套完整的技术方法体系:首先基于根河林业局辖区的实际森林调查数据,分别从Landsat 7 ETM+ Collection 2 Level 2和Sentinel 2 L2A获取遥感辅助数据;接着通过主成分分析(PCA)和Haralick纹理特征提取等方法构建候选变量池;然后采用"bootstrap stepAIC"程序进行变量选择,建立加权最小二乘(WLS)回归模型;最后通过蒙特卡洛模拟对混合估计器和CMB估计器进行性能比较,系统评估了采样设计、样本覆盖率和聚类大小等参数对估计精度的影响。

4.1. 基于元素级别的模型构建

研究成功建立了两个加权最小二乘模型:WLS-1模型基于Sentinel 2完整数据,用于CMB估计器;WLS-2模型基于Landsat 7 SLC-off缺失数据,用于混合估计器。诊断分析显示两个模型均无明显系统偏差,预测区间能够以95%的概率保证覆盖实际样地水平的立木材积值。值得注意的是,基于Sentinel 2的模型相对均方根误差(rRMSE)比Landsat 7 SLC-off模型低约20%,体现了更高精度的预测能力。

4.2. 总体水平的估计器比较

研究发现混合估计器在简单随机抽样和聚类抽样两种情况下均表现出与CMB估计器相近的估计效果。当遥感数据集样本量达到600个元素(对应0.00005%的抽样强度)时,混合估计器的精度已接近使用全覆盖样本的CMB估计器。这一结果表明,即使使用存在缺陷的Landsat 7 ETM+ SLC-off数据,混合估计器也能达到与完整Sentinel 2 L2A数据相当的精度水平。

4.3. 基于混合估计的Landsat 7森林调查应用

研究证实混合估计器能够有效克服Landsat 7 SLC-off数据缺陷带来的限制。所有推断结果的变异系数(CV%)均小于10%,满足中国国家森林清查的精度标准要求。与需要辅助参考影像的插值方法相比,混合估计器不引入间隙预测值的不确定性,且不受时间应用限制,展现出更强的灵活性。

4.4. 不确定性分析与质量控制

通过方差分解分析发现,总方差主要由两个组成部分构成:第一部分源于遥感数据集的抽样不确定性,第二部分源于模型参数估计。研究表明,当遥感数据集样本覆盖范围扩大时,两个方差分量均呈现下降趋势,但第一部分下降速度更快。模型参数估计的不确定性在总方差中占主导地位,这意味着提高模型质量是降低不确定性的关键。

4.5. 聚类大小对总体参数估计的影响

研究发现聚类大小与估计精度之间存在明显的反向关系:在相同样本覆盖率下,较小的聚类大小通常能获得更高的估计精度。对于均匀分布的总体,聚类大小对精度的影响相对较小;而对于异质性较强的总体,较小的聚类大小有助于获得更平衡的辅助数据集,从而降低推断过程的不确定性。

4.6. 精度与样本覆盖率的权衡

研究揭示了估计精度与遥感数据集样本量之间的非线性关系:当样本量较小时,增加样本量能显著提高精度;但当样本量达到一定拐点后,继续增加样本量对精度的改善效果变得有限。这一发现为在实际森林调查中优化资源配置提供了重要依据。
该研究的结论部分强调,混合估计器为缺陷遥感数据在森林资源调查中的应用提供了有效解决方案。它不仅能够克服Landsat 7 ETM+ SLC-off数据的局限性,还在成本效益和灵活性之间实现了良好平衡。通过优化抽样设计参数(如选择较小的聚类大小和较大的样本量),可以进一步提高估计精度,支持从国家森林资源调查到碳汇评估等多种应用场景。
这项研究的创新之处在于,它首次系统验证了混合估计器在处理缺陷遥感数据方面的优越性,为历史遥感数据的有效利用开辟了新途径。在遥感技术快速发展的今天,这项研究成果不仅对森林资源监测具有重要意义,也为其他领域的遥感数据应用提供了有益借鉴。随着全球对森林生态系统服务价值认识的不断深入,这种能够平衡精度与成本的技术方法,将在支持森林可持续经营和气候变化应对策略方面发挥越来越重要的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号