基于植被指数和纹理特征的详细土地利用分类模型

《Remote Sensing Applications: Society and Environment》:Detailed Land Use Classification Model Based on Vegetation Indices and Texture Features.

【字体: 时间:2025年11月06日 来源:Remote Sensing Applications: Society and Environment 3.8

编辑推荐:

  土地利用分类模型基于Sentinel-2影像与机器学习,整合22种植被指数和4类纹理特征,通过随机森林算法优化SMOTE oversampling、KNN imputer和Standard Scaler预处理,显著提升细分类精度,为动态热带地区碳储量估算提供新方法。

  
作者:Yuli Maulani | Kridanto Surendro
印度尼西亚万隆理工学院电气工程与信息学院信息学系,邮编40132

摘要

由于森林砍伐、城市化和土地利用变化,土地用途发生了显著变化,这严重影响了环境质量,尤其是降低了碳储存能力并增加了温室气体排放。为了满足精确绘制土地覆盖图的需求,本研究基于Sentinel-2卫星图像开发了一种分类模型,采用机器学习方法,将22个植被指数和4个纹理特征作为输入变量。该方法旨在克服具有相似光谱特性的土地覆盖类别之间的区分难题,例如初级红树林和次级红树林之间的区分。评估了四种机器学习算法,最终确定最佳模型为随机森林(Random Forest),其最佳配置包括SMOTE过采样、KNN插补器和标准缩放器(Standard Scaler)在数据预处理阶段的应用。结果表明,结合光谱特征和纹理特征可以提高分类准确性。本研究的主要贡献包括开发了一种达到子类别级别的土地覆盖分类方法,并证明了整合纹理特征和多种植被指数可以提升基于机器学习的分类模型的性能。这些发现对于支持土地变化监测和碳储量估算尤为重要,特别是在像印度尼西亚这样的动态热带地区。

引言

土地用途的变化,特别是由于森林砍伐、城市扩张和土地利用转换,显著降低了环境质量并增加了温室气体排放。这些变化减少了生态系统的碳储存能力,加速了全球变暖(Bennett等人,2024年)。
土地覆盖分类的主要挑战之一是难以区分具有相似光谱特征的类别,例如初级红树林和次级红树林,或者农业用地和灌木地之间的区别。尽管传统的基于实地的方法能够产生非常准确的估算结果(Fang等人,2001年),但其大规模应用往往耗时、成本高昂且资源密集。相比之下,遥感技术(如卫星图像)为土地覆盖分类和碳储量估算提供了更高效和可扩展的解决方案(Kamilaris和Prenafeta-Boldú,2018年;Srinet等人,2023年)。
许多先前的研究依赖于中等分辨率的卫星图像,例如Landsat(Griffiths等人,2013年;Lu,2005年;Ozelkan等人,2015年)、SPOT(Tucker等人,2005年)、MODIS(Roy等人,2008年;Tucker等人,2005年)、ALOS AVNIR-2(Suyadi等人,2013年)以及广泛使用的Sentinel-2(Abdi,2020年;Hosseiny等人,2022年;Mohammadpour等人,2022年;Nasiri等人,2022年;Persson等人,2018年)。Sentinel-2由欧盟欧洲航天局(ESA)的Copernicus地球观测计划于2015年发射(Mohammadpour等人,2022年)。Sentinel-2的空间分辨率为10至60米,重访周期为5天(GEE,2015年)。
在分类过程中,作为变量的植被指数目前仅限于NDVI、EVI和SAVI(Ashazy和Cahyono,2013年;Hosseiny等人,2022年;Sukristiyanti等人,2022年)。Sentinel-2拥有13个光谱波段,可以研究额外的植被指数以辅助土地覆盖分类。此外,利用纹理特征是区分农业用地和居民区等空间结构的一种方法(Mohammadpour等人,2022年)。Hall-Beyer(2017年)的研究也支持这一观点,他指出结合多种光谱和空间特征可以提高分类准确性,尤其是在具有混合或重叠光谱特征的类别中。
机器学习算法,如随机森林(RF,Nasiri等人,2022年;Sukristiyanti等人,2022年)、支持向量机(SVM,Abdi,2020年)、XGBoost(Hosseiny等人,2022年)和决策树(CART,Afasel等人,2022年),已被广泛用于土地覆盖分类,并在各种情况下表现出良好的性能。然而,现有研究往往未能将土地类别细分为更详细的子类别(Mora等人,2014年;Sukristiyanti等人,2022年)。
为了解决这些局限性,本研究开发了一种具有更高细节水平的土地覆盖分类模型,能够达到土地覆盖类别的子类别级别。所提出的方法结合了22个植被指数和4个纹理特征,这些特征基于从Sentinel-2图像中提取的灰度共生矩阵(GLCM),从而更全面地表示光谱和空间信息。本研究的主要目标是根据分类指标评估和确定表现最佳的机器学习模型,特别是在区分具有高光谱相似性的土地覆盖类别方面。

材料与方法

本节详细介绍了所构建模型的开发过程。研究方法如图1所示。

评估结果

经过训练过程和在不同特征选择场景下的模型测试后,进行了性能评估,以评估每种算法的数据分类能力。表4显示了每种算法在四种特征选择场景下的G-Mean值。
根据表4的结果,随机森林(RF)算法在所有特征选择场景中始终提供最高的G-Mean值,尤其是在使用所有特征时,得分达到0.7652。KNN算法在使用部分特征的情况下略好一些

模型性能

四种算法在不同场景下的土地覆盖分类比较结果显示,使用随机森林(RF)和所有特征(植被和纹理)以及SMOTE过采样技术可以获得最高的g-mean分数,并能分类所有类别,包括少数类别。这些结果与Sheykhmousa等人(2020年)的研究结果一致,证明了土地覆盖分类的性能优于其他机器学习(ML)分类器,如支持向量机(SVM)。甚至Ma等人(2017年)也发现随机森林(RF)具有优势

结论

本研究利用Sentinel-2卫星图像,采用基于像素的分类方法开发了一种土地覆盖分类模型。该模型以22个植被指数特征和4个纹理特征作为输入变量。对各种算法的评估结果表明,最佳模型是采用随机森林(Random Forest)算法,并结合了SMOTE过采样技术、KNN插补器和标准缩放器(Standard Scaler)的配置

作者贡献声明

Kridanto Surendro:撰写——审稿与编辑、撰写——初稿、验证、监督、资源准备。Yuli Maulani:撰写——初稿、软件开发、方法论设计、数据分析、正式分析、数据整理、概念构建

利益冲突声明

作者声明他们没有已知的财务或个人利益冲突,这些冲突可能会影响本研究的结果。

伦理声明

本研究使用了来自公共仓库(如Google Earth Engine和Sentinel-2)的公开可用卫星数据。由于没有涉及人类参与者或敏感的个人数据,因此不需要伦理审批。

利益冲突声明

? 作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:Yuli Maulani报告称获得了印度尼西亚教育捐赠基金(LPDP)的财政支持。如果还有其他作者,他们声明没有已知的财务利益或个人关系可能影响本文的研究结果。

致谢

本研究得到了印度尼西亚教育捐赠基金(LPDP)和印度尼西亚财政部的资助,通过硕士奖学金计划提供研究经费。作者感谢LPDP的慷慨支持,使这项研究得以实施。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号