编辑推荐:
为解决现有森林生态系统绘图中空间分辨率和时间约束问题,研究人员利用 Sentinel-2 多光谱卫星影像和机器学习开展常绿 / 落叶叶型分类研究。通过优化合成方法等,模型 F1 分数达 0.857,优于哥白尼产品,为森林管理等提供新方案。
森林作为地球生态系统的核心组成部分,在碳汇、生物多样性保护等方面发挥着关键作用。精准区分常绿和落叶树种是森林监测与管理的基础,但传统遥感方法受限于空间分辨率和时间动态,难以在复杂林况下实现高精度分类。例如,云层覆盖会遮挡卫星观测,混合像元问题在森林边界尤为突出,且不同季节的光谱变化可能混淆分类结果。此外,现有模型在跨年份数据应用时往往需要重新训练,限制了其泛化能力。因此,如何利用多时相遥感数据提升分类模型的稳定性和跨年度适应性,成为亟待解决的科学问题。
为应对上述挑战,德国相关研究机构的研究人员开展了一项基于 Sentinel-2 卫星影像和机器学习的常绿与落叶叶型分类研究。该研究成果发表在《Ecological Informatics》,旨在通过数据驱动方法优化分类模型,实现无需重新训练即可适应不同年份数据的时间泛化能力。
研究主要采用以下关键技术方法:首先,使用 Sentinel-2 Level-2A 影像(10 米分辨率),结合 Google Earth Engine(GEE)云平台进行数据处理,通过云雪掩膜预处理提升数据质量;其次,运用递归特征消除(RFE)算法从 220 个光谱波段和植被指数中筛选出 10 个关键特征,包括 GDVI、MIRBI 等植被指数及 SWIR 波段 B11;然后,优化六种合成方法(如均值、中位数、标准差等),确定每年最佳合成数量以平衡时间细节和计算效率;最后,训练并调优八种机器学习模型,包括随机森林、XGBoost 等,通过分层五折交叉验证评估模型性能。研究数据来自巴伐利亚严格森林保护区的 16,162 个树冠样本(2019-2023 年),并使用 ForestGEO Traunstein 森林动态样地(2018 年)进行独立验证。
3.1 光谱特征选择结果
通过 RFE 确定的前 10 个关键特征中,九为光谱指数(如 GDVI、MBWI),一为 SWIR 波段 B11。这些特征有效捕捉了植被水分含量、季节变化等信息,其中 B11 对区分植被类型尤为重要,与其他研究中短波红外波段在植被分类中的关键作用一致。
3.2 合成优化结果
不同合成方法的最佳合成数量差异显著:均值、中位数、最小值合成器需 6 个 / 年以捕捉季节变化,最大值和标准差合成器需 4 个 / 年,偏度合成器仅需 2 个 / 年即可反映关键物候转折。优化后的合成策略显著提升了模型对跨年度光谱变异的鲁棒性。
3.3 模型训练与选择结果
在八种模型中,树基模型如 HistGradientBoostingClassifier 和 ELMClassifier 表现最佳,F1 分数达 0.863,显著优于支持向量机(SVM)和 k - 近邻(k-NN)等算法。极端学习机(ELM)因训练效率高且准确率高,被选为最优模型。
3.4 时间与空间泛化结果
最优模型在 2018 年独立测试集上实现 F1 分数 0.857、准确率 0.831,超越 Copernicus 高分辨率叶型产品(F1=0.853,准确率 = 0.819)。模型对树高>20 米的高大树木分类效果显著提升,F1 分数接近 1,表明高大树冠的纯净像元更易通过光谱特征区分。
3.5 树高与分类性能分析
模型性能与树高呈正相关:0-20 米范围内,F1 分数随高度下降,可能因低矮树木受林下植被干扰及混合像元影响;>20 米时,纯净像元比例增加,分类精度显著提升,验证了树高在模型泛化中的关键作用。
研究表明,基于 Sentinel-2 影像和机器学习的定制化分类框架可有效提升常绿 / 落叶叶型分类的时间泛化能力。通过特征选择与合成优化,模型无需重新训练即可适应不同年份数据,且在高大树木分类中表现卓越。该方法为大范围森林监测提供了低成本、可扩展的解决方案,尤其适用于温带森林生态系统,对提升森林管理、碳汇估算和气候变化响应研究具有重要意义。未来研究可进一步整合雷达数据或扩展至其他气候区,以增强模型的普适性。