年度全国树木冠层覆盖度测绘:一种具有时间可转移性和改进的不确定性量化能力的新工作流程

《Science of Remote Sensing》:Annual National Tree Canopy Cover Mapping: A Novel Workflow with Temporal Transferability and Improved Uncertainty Quantification

【字体: 时间:2025年10月11日 来源:Science of Remote Sensing 5.2

编辑推荐:

  NLCD TCC v2021.4通过Google Earth Engine整合Landsat和Sentinel-2数据,采用5x5滑动窗口随机森林模型,结合不确定性指标Tau和FIA参考数据,实现了CONUS连续年度30米格网树冠覆盖数据集,时空一致性提升,支持生态监测和管理应用。

  近年来,随着遥感技术的快速发展,科学家们在土地覆盖监测方面取得了显著进展。树冠覆盖(Tree Canopy Cover, TCC)数据作为反映森林结构和生态健康的重要指标,已被广泛应用于政策制定、自然资源管理以及生态学研究等多个领域。美国农业部(USDA)森林服务局与美国地质调查局(USGS)合作,利用多种卫星数据源,构建了新一代的国家土地覆盖数据库(NLCD)树冠覆盖数据产品,即NLCD TCC v2021.4版本。这些数据不仅提供了每年30米分辨率的网格化时间序列信息,还提升了数据的时效性、准确性和不确定性评估的全面性,为生态研究和环境管理提供了更为可靠的基础。

在TCC数据的生产过程中,研究人员采用了一种创新的工作流程,结合了本地计算环境与Google Earth Engine(GEE)的云平台。这一方法显著降低了数据处理的开发成本,同时提高了生产效率。GEE平台提供了丰富的卫星影像资源,以及高效的并行计算能力,使得研究人员能够在不依赖大量本地计算资源的情况下,完成大规模的遥感数据处理和建模任务。此外,该方法还减少了人为主观判断对数据质量的影响,从而提升了结果的客观性和一致性。研究人员利用GEE平台生成了基于Landsat和Sentinel-2卫星影像的年度复合图像,并通过随机森林(Random Forest, RF)模型预测了每个像素的树冠覆盖值及其标准误差(SE)。通过5x5的移动窗口方法,对54个等面积的480x480公里的图像块进行建模,以确保模型在不同区域的适用性,并减少边界效应。

为了确保数据质量,研究人员在模型训练前对参考数据进行了严格的验证和清理。参考数据来源于美国农业部森林服务局的森林调查与分析(FIA)项目,覆盖了63,010个样点。在数据处理过程中,研究人员剔除了476个质量不佳的样点,1,972个低置信度的样点以及703个存在多张影像解释的样点。此外,还实施了三种时间维度的QAQC检查,以确保参考数据的时间稳定性。其中包括对光谱稳定性进行评估,识别出时间序列中光谱变化较小的样点;对虚假零树冠覆盖(False Zero TCC)进行检查,剔除了844个错误记录;以及对时间不匹配问题进行分析,识别并移除了1,384个与森林覆盖损失相关的样点和2,792个与森林覆盖增长相关的样点。最终,参考数据减少了7.9%,剩余的55,356个样点被随机分为训练集和独立验证集,其中70%用于模型训练,30%用于独立地图准确率评估。

在建模过程中,研究人员采用了两种预测数据集(Set1和Set2)以应对不同时间段的影像质量问题。Set1包含所有可用的Sentinel-2和Landsat 5-8影像,而Set2则排除了受Landsat 7扫描线校正问题影响的影像。这一策略有效缓解了由于影像缺失而导致的时间序列不完整问题,同时也保持了影像数据的稳定性。在2016年之后,随着Sentinel-2影像的大量可用,研究人员缩短了生长季的时间窗口,从6月1日至9月30日调整为7月1日至9月1日,以减少影像处理的计算负担。通过LandTrendr算法对影像进行处理,进一步平滑了时间序列的光谱数据,提高了预测的准确性。

模型的预测结果被用于生成全国范围内的树冠覆盖地图,并通过一系列后处理步骤进行优化。其中包括使用非树掩膜(Non-tree Masks)对预测结果进行修正,确保只有树冠覆盖区域被保留。同时,对非城市区域采用了最小映射单元(Minimum Mapping Unit, MMU)策略,将小于四个连续像素的树冠覆盖区域归为零值。在城市区域,研究人员结合了美国人口普查局的地理编码和参考数据,对树冠覆盖值进行了进一步的过滤,确保城市中的树冠覆盖数据与森林覆盖数据的准确性。这些后处理步骤显著降低了地图边缘的不连续性,并提高了整体数据质量。

为了进一步评估模型的准确性,研究人员在国家尺度上进行了独立的地图验证。他们使用了16,607个未用于模型训练的参考数据点,并通过Thiessen多边形方法计算了加权的均方根误差(RMSDw)和加权的平均绝对误差(MAEw)。结果显示,全国范围内的RMSDw为12.8%,MAEw为8.0%,表明新版本的TCC数据具有较高的准确性和稳定性。此外,研究人员还开发了Tau(τ)不确定性指标,用于量化模型预测的不确定性。通过模拟数据和Bootstrap方法,他们能够更精确地估计预测值的置信区间,为环境和生态应用提供了更全面的数据支持。

新版本的TCC数据在实际应用中展现出巨大的潜力。例如,研究人员利用这些数据分析了森林火灾对树冠覆盖的影响,展示了火灾前后不同区域的树冠覆盖变化趋势。这些数据不仅能够帮助研究人员了解森林生态系统的动态变化,还能为森林恢复、水土保持和水资源管理提供科学依据。此外,TCC数据还可以用于评估森林管理措施的有效性,如采伐活动对树冠覆盖的影响。在不同的生态区域,如西南部的松木-山核桃森林、东南部的落叶和针叶森林、中西部的落叶森林以及西北部的针叶森林,研究人员发现这些数据能够有效捕捉树冠覆盖的变化模式,为生态学研究提供了新的视角。

尽管新版本的TCC数据在多个方面取得了显著进展,但仍存在一些局限性。例如,在高异质性土地覆盖区域,使用TCC数据进行面积估算时,统计估计方法应优先于像素求和技术,以避免因数据分布不均而导致的偏差。此外,在高密度城市区域,TCC数据的精度可能受到限制,需要进一步优化。为了应对这些问题,研究人员在后续的数据发布中对工作流程进行了改进,包括将树冠覆盖数据回溯至1985年,以提供更长的时间序列信息。同时,对某些特定区域的模型边界问题进行了优化,减少了不同区域之间的差异。在2023年的数据发布中,研究人员还调整了城市树冠覆盖的掩膜标准,以提高数据的准确性。

新版本的TCC数据不仅为科学家提供了丰富的研究资料,也为政策制定者和土地管理者提供了重要的决策支持。这些数据能够帮助评估森林健康状况,预测森林火灾风险,以及监测森林资源的变化趋势。此外,TCC数据的广泛应用也促进了遥感技术在生态学、地理学和环境科学领域的进一步发展。研究人员通过这些数据,能够更深入地理解森林生态系统的变化规律,为可持续发展和生态保护提供科学依据。

总的来说,NLCD TCC v2021.4版本的发布标志着美国在森林监测和遥感数据应用方面迈出了重要的一步。通过结合本地和云平台的计算资源,研究人员不仅提高了数据的处理效率,还确保了数据的准确性和可靠性。这一创新的工作流程为未来TCC数据的更新和应用奠定了坚实的基础,同时也为全球范围内的土地覆盖监测提供了可借鉴的经验。随着遥感技术的不断进步,TCC数据将在生态研究和环境管理中发挥越来越重要的作用,为实现可持续发展目标提供关键支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号