一种用于基于向量的土地覆盖数据集几何积分的多标准优化方法
《International Journal of Digital Earth》:A multi-criteria optimization approach for the geometric integration of vector-based land cover datasets
【字体:
大
中
小
】
时间:2025年09月26日
来源:International Journal of Digital Earth 4.9
编辑推荐:
本文提出了一种融合遥感数据与OpenStreetMap矢量数据的LULC几何调和方法,通过约束Delaunay三角剖分构建平面分割,并利用多准则优化模型与图切割算法实现边界和面积的协同优化,最终在德国北莱茵-威斯特法伦州森林区域验证,IoU达0.831,Hausdorff距离为1251.37米,显著提升几何一致性。
土地利用/土地覆盖(LULC)地图在理解人类活动与自然环境之间的复杂关系中起着至关重要的作用。本文提出了一种新的方法,将来自不同数据源的LULC信息进行融合。具体而言,我们的目标是结合遥感影像中提取的LULC信息与志愿者绘制的LULC信息,特别是来自开放街图(OpenStreetMap,简称OSM)的LULC信息。由于OSM是基于向量表示对象的,我们希望生成一个协调一致的向量图层作为输出,因此我们的方法是在向量环境中进行信息融合,利用计算几何的方法。该方法首先将遥感数据向量化,生成一组多边形。然后将这些多边形的边界与OSM中LULC多边形的边界叠加,并通过约束Delaunay三角剖分(CDT)来细化生成的平面划分,从而形成结构化的基础。在主要步骤中,我们通过计算CDT中三角形的最优选择,并解决相邻三角形之间的边界问题,生成输出多边形。本文方法的创新之处在于设计了一个结合五个显式建模标准的目标函数:(1,2)对第一/第二输入图层边界的遵循程度,(3,4)对第一/第二输入图层面积的遵循程度,以及(5)将输出多边形泛化到期望的详细程度。我们展示了如何通过基于图切割的方法高效地解决该模型。将该方法应用于德国北莱茵-威斯特法伦州的森林覆盖区域,结果令人鼓舞,输出与参考数据高度相似。在七个感兴趣区域中,平均交并比(IoU)为0.831,离散Hausdorff距离为1251.37米,证明了该方法在向量框架中准确映射LULC的能力,实现了最优的几何协调。
### 1. 引言
科学界将土地利用和土地覆盖定义为两个不同的术语,各自具有不同的内涵(C. P. Giri, 2012)。土地利用指的是与土地使用相关的各种人类活动和用途,而土地覆盖则指地球表面的自然特征或物理特性(Burley, 1961;Chamling and Bera, 2020)。LULC地图展示了人类活动及其与自然环境的相互作用(Alqurashi and Kumar, 2013)。它们还被用作研究生态系统和地系统服务的基础工具,这些服务依赖于准确的空间信息来评估环境中的生物和非生物组成部分所提供的利益。此外,地多样性(geodiversity)这一新兴概念,越来越多地被认识到在支持生物多样性和景观功能方面的重要作用。为了进行自然资源管理(Arnold等,2020;Teck等,2023),气候变化研究(Santos等,2021;Turner, 1994),生物多样性(Falcucci等,2007;Ghorbanian等,2020;Haines-Young, 2009)和环境研究,获取关于LULC类型的位置、类型和范围的可靠且准确的信息至关重要。城市区域的迅速扩张,以及耕地或森林向城市空间的转变,已显著改变了土地利用模式(图1)(K. Gao等,2025)。此外,由于新的开发策略(例如集约单一作物种植或油棕等经济作物的扩张),耕作实践和农业方法的变化进一步凸显了生产最新LULC地图的有效且高效方法的迫切需求(Shah and Wu, 2019)。
图1展示了2010年至2024年间德国科隆和波恩四个不同地区的城市LULC变化示例。图像来源:Google Earth Pro,? Google,影像日期:2010-2024。
### 地理信息系统(GIS)与遥感(RS)技术的发展
地理信息系统(GIS)与遥感(RS)技术的演进,使RS和GIS成为获取LULC信息的两种强大工具,以减少提取LULC所需的时间和成本(Chowdhury等,2020;Dhanaraj and Angadi, 2022)。尽管RS和GIS为LULC估计提供了有价值的工具,但它们并非没有局限性。例如,RS通过卫星影像提供接近实时的LULC数据,具有高空间和时间频率(Aliabad and Ghaderpour, 2025)。然而,从RS数据中提取LULC面临准确界定不同LULC类型边界这一挑战,这一任务高度复杂且需要精确度(Foody, 2002;Stehman and Foody, 2019)。同时,GIS技术通过整合空间数据和分析工具,能够准确提取LULC。然而,尽管在空间分析方面表现出色,GIS在快速变化的环境中保持LULC地图的更新面临挑战(G. Chen等,2012;Herold等,2005;Singh, 1989)。
在本文中,我们引入了一种新颖的方法,将两个不同数据源的LULC数据进行整合,以利用每种数据源的优势。我们的方法将来自遥感观测的LULC数据与志愿者贡献的高精度向量GIS LULC信息相结合,特别是来自OSM的数据。这种融合使我们能够利用这两种数据源固有的细节和准确性。
该过程首先通过向量化遥感数据,将其转换为一组多边形。然后将这些多边形与OSM中的LULC多边形边界叠加,以建立数据整合的基础结构。使用CDT对结果多边形进行细化,生成一个平面划分,作为融合过程的主要基础。为了增强CDT生成的三角形,我们在计算CDT之前引入了Steiner点。这些额外的Steiner点增强了我们三角形测绘单元的精度。而不是依赖于每个数据集中的原始LULC多边形,我们的方法将这些由两个数据集分解得到的三角形作为最小的测绘单元或LULC多边形。
在方法的核心步骤中,我们关注于仔细选择三角形并形成连贯的多边形,以准确表示LULC边界。本文方法的创新之处在于设计了一个目标函数,该函数结合了五个关键标准来指导选择过程。具体而言,这些标准包括(1,2)对第一/第二输入图层边界的遵循程度,(3,4)对第一/第二输入图层面积的遵循程度,以及(5)将输出多边形泛化到期望的详细程度。为了高效解决优化问题,我们采用了基于图切割的方法。我们的方法在重叠区域之间应用多标准选择过程,并在非重叠区域添加额外的测绘单元,以增强几何一致性。简而言之,在此上下文中,每个三角形在整体数据集中被分类为:既不属于两个数据集也不属于其中之一的三角形,以及与两个数据集都相关的三角形。基于三角形分类和它们的面积和边界特征,使用图切割技术解决了优化问题,从而生成最终的准确融合LULC数据集。
研究的历史背景以及我们的贡献在下一部分中进行了全面探讨。第3节详细介绍了方法论背景,并介绍了本文研究中评估的新优化方法。第4节展示了核心研究区域以及本研究中使用的数据。第5节和第6节分别介绍了所提出方法生成的输出以及结果讨论。最后,第7节总结了结论。
### 2. 研究背景和创新贡献
在本节中,我们首先探讨了使用卫星影像和GIS进行LULC映射的关键研究背景,强调最常用的数据集、产品和方法,突出它们的优势和局限性。然后概述了我们对LULC估计的主要贡献,以解决现有挑战并提高对不同地理区域和景观条件的适应性。
#### 2.1. 使用RS和GIS技术的LULC分类
RS是一种经济高效的方法,适用于大范围获取最新信息,因为其覆盖范围广且能提供重复测量(Ghorbanian等,2020;Xie等,2008;Zhu and Yang, 1998)。LULC地图通常通过两种主要分析方法从RS数据中得出:监督分类和非监督分类(M. Li等,2014)。
在非监督分类中,RS图像根据图像值的自然分组被划分为几个类别,而无需训练数据或对研究区域的先验知识(Richards and Richards, 2022)。常用的非监督分类方法包括K均值算法(Sinaga and Yang, 2020),迭代自组织数据分析(ISODATA)技术(Vimal等,2022),自组织映射(SOM)(Qu等,2021),以及层次聚类方法(M. Li等,2014)。
相比之下,监督分类涉及图像分析师选择具有已知类别的代表性样本点(训练样本)。然后将图像中每个像素的光谱特性与训练样本进行比较,并根据预定义的决策规则将像素分配到相应的类别(M. Li等,2014)。已经开发出多种监督分类方法,包括最大似然分类器(MLC),最小距离到均值分类器(MDMC),马氏距离分类器(MDC),平行六面体方法,K近邻分类器(KNN),以及各种机器学习技术,如人工神经网络(ANN),分类树,随机森林(RF),支持向量机(SVM)和遗传算法(GA)(Abbas and Jaber, 2020;J. Chen等,2025)。
到目前为止,已经生成了超过22种全球LULC产品,其空间分辨率从10米到1公里不等(Wang等,2023)。欧洲航天局(ESA)的WorldCover产品在2020年和2021年以10米的空间分辨率(https://esa-worldcover.org),ESRI的10米全球LULC(https://livingatlas.arcgis.com/landcover),Google和世界资源研究所(WRI)的Dynamic World近实时全球10米LULC(https://dynamicworld.app/explore),Copernicus全球土地服务(CGLS-LC)的100米空间分辨率覆盖层(https://land.copernicus.eu),以及Landsat全球土地覆盖(GLC)产品中的精细分类系统在30米空间分辨率(GLC_FCS30)(https://gee-community-catalog.org),以及中分辨率成像光谱辐射计(MODIS)土地覆盖类型产品(https://ladsweb.modaps.eosdis.nasa.gov)是目前最常用的全球LULC产品之一(Friedl等,2002)。
与监督和非监督像素分类不同,图像分割分析是另一种LULC分类方法,它关注于空间上下文和几何信息(H. Gao等,2021)。在这些方法中,图像首先被分割为多边形,基于特定的光谱属性使用算法,如多分辨率分割、分水岭分割或均值漂移聚类(Kavzoglu和Tonbul,2017)。然后对分割后的区域进行分类,通常使用随机森林或支持向量机等机器学习分类器,以创建更准确且具有上下文意识的LULC地图(Zaabar等,2022)。迄今为止,研究人员已经开发了多种方法,以使用基于对象的技术提高LULC地图的几何同质性。
他们发现,将RS基础的LULC数据与GIS向量数据源结合,可以增强LULC地图的几何准确性,并通过结合地理知识来克服检测真实土地利用面积边界方面的限制。最近利用大数据和RS的研究也展示了在各种领域,包括城市扩张、海洋养殖分布和多尺度景观功能异质性方面进行细粒度映射和功能分析的进展(K. Gao等,2024;K. Gao等,2025;Liu等,2024)。虽然这些研究主要强调主题或功能异质性,但它们共同突显了提高空间细节的广泛重要性,这与我们通过整合多个数据集提高LULC产品的几何保真度的目标相一致。在此基础上,一个广泛认可且常用的GIS向量数据源是开放街图(OSM)。作为一个免费和开放的地理数据库,OSM由全球志愿者社区共同更新和维护(Jokar Arsanjani等,2015),通过节点、线和关系表示物理特征,如道路和建筑(Vargas-Munoz等,2020)。关于OSM的更多细节请参见第4.2.2节。一些研究尝试将LULC数据与OSM结合在分类方法中,以提高几何准确性。例如,Estima和Painho(2013)旨在通过实施一个分步数据整合框架来创建高精度的LULC地图。他们的方法涉及将OSM LULC数据和欧洲土地覆盖(CLC)数据库进行整合。他们首先对OSM数据集进行深入分析,生成一个初始多边形图层。接下来,他们建立了OSM和CLC数据集分类属性之间的关系。通过检查这些关系,他们利用CLC图层的属性信息优化了OSM多边形的分类。类似的研究由Fonte等(2017)进行,他们旨在通过结合OSM LULC来增强权威的GLC_FCS30 LULC数据集。Jokar Arsanjani等(2013)提出了一种方法,使用OSM数据生成土地利用模式,而不依赖官方来源。他们应用了基于GIS的分层决策树来分类维也纳的地块。结果通过纹理-变异性分析和属性比较与全球环境和安全监测城市图(GMESUA)进行验证。基于OSM多边形,Hu等(2016)推导出了北京,中国LULC地图的多边形。从OSM的兴趣点(POI)数据中提取了10个特征,以及从Landsat 8图像中得出的两个指数,用于将多边形分类为八个和十六个土地利用类别,分别在两个不同的分类级别中。Schultz等(2017)开发了一种融合LULC地图,通过整合RS数据与OSM的全球开放土地覆盖。他们首先利用60个OSM标签,将第二级Corine土地覆盖分类应用于海德堡,德国的研究区域。对于剩余的空白,他们使用RS LULC地图通过监督的RF分类器进行填充。这种方法通过结合OSM数据和RS观测的优势,实现了全面且精确的LULC地图。Bai等(2025)也探索了整合RS影像和OSM数据以增强地理场景理解,使用多模态自监督学习框架。该框架以非监督方式提取和交互来自RS影像和OSM数据的特征,包含三个关键组件:信息提取,信息交互(使用空间相关性)和信息协作(通过联合掩码重建)。该模型生成三种输出:RS-only,OSM-only,和融合的RS-OSM特征,这些特征用于多个下游任务。
大多数参考研究者假设OSM多边形准确描绘了土地覆盖边界,并且表现出最佳的几何同质性。因此,他们的重点是利用RS生成的LULC地图更新这些多边形的属性。然而,鉴于土地覆盖的动态性,特别是在城市地区或经历显著变化的区域,仅依赖OSM多边形的几何准确性可能无法始终产生最可靠的结果。
### 3. 方法论
本研究采用图切割方法解决多标准优化问题并几何整合两个LULC数据集。为了阐明图切割方法的作用,我们首先提供其方法、结构和应用的全面概述。然后,我们介绍用于几何整合LULC数据集的多标准优化方法。
#### 3.1. 方法背景:图切割
图切割方法使用图表示,其中节点表示数据元素,边定义它们之间的关系(Ishikawa, 2012)。核心思想是移除一组最小权重的边,使得两个专用节点s和t(源和汇)最终处于两个不同的连通组件中(Boykov and Funka-Lea, 2006)。最小s-t切割问题与最大流问题密切相关(Ford and Fulkerson, 1956)。图切割广泛用于解决组合优化问题,特别是在计算机视觉中的图像分割和聚类(X. Chen and Pan, 2018;Peng等,2013;Shi and Malik, 2000;Wu and Leahy, 1993)。在图像处理和分割应用中,一个常见的任务是将前景像素与背景像素分离。这一任务通过引入一个源s(表示前景或感兴趣的对象)和一个汇t(表示背景)来实现。这些两个节点通过边连接到图像中的像素节点(或超像素)。边权重表示两个像素属于同一区域的可能性,基于强度、颜色、纹理或其他特征(Boykov and Kolmogorov, 2004)。图切割通过最小化成本函数(通常结合边界平滑和区域一致性)找到前景和背景的最佳分割方式。由于与最大流问题的关系,最小s-t切割可以通过Orlin(2013)提出的算法高效计算,其时间复杂度为O(nm)。这里,n和m分别表示图中的节点数和边数。对于稀疏图,其中m=O(n),他们将运行时间复杂度改进为O(n2/log n)。这种改进的时间复杂度适用于我们的方法,因为底层图是基于平面划分的邻接图。
与局部方法不同,图切割在某些能量公式下保证最优分割,即使在有噪声的图像中也能很好地工作,并且可以结合各种视觉线索和约束(Kolmogorov and Zabin, 2004)。Boykov和Funka-Lea(2006)探讨了图切割在图像数据中用于对象分割的应用,突出了其效率、鲁棒性和整合多样化视觉线索的能力。
Yuan等(2014)引入了一种新的图切割方法,用于从图像中检测道路区域,以解决单目视觉道路分割中的环境干扰。他们使用多层感知器(MLPs)来估计s-t图中邻接链接的权重,从而提高算法处理道路表面复杂、变化外观的能力。Prabhu和Tensing(2015)引入了一种适应的图切割分割方法,结合边界模糊分类器用于卫星图像分类。该方法首先使用适应的图切割技术对图像进行分割,以识别形状的逆向。接下来,从分割图像中提取特征,并使用模糊分类器对未知边界进行分类。最后,通过任意对象索引进行对象识别。Yang等(2021)提出了基于图切割的方法,用于在超高分辨率RS图像上生成道路注释。该方法结合了超像素技术与图切割方法,用于道路分割,通过OSM数据进行优化。道路注释是通过此过程自动创建的。关于像素级数据融合,Thao等(2022)评估了一种新颖的方法,通过考虑单个模型的本地性能,重建多十年的气候平均值,这与常用的多模型平均方法形成对比。他们使用图切割选择每个网格点的最合适的模型,同时保持空间一致性。
图切割已在各种图像分析任务中广泛应用,包括分割、对象识别和边界检测(Yi和Moon, 2012)。然而,将其应用于向量数据,如GIS或基于向量的图像表示,是一个相对较新的发展。最近,一些研究已经将图切割算法适应于处理向量数据。例如,Abrahamsen等(2020)使用图切割方法将多个多边形集分离为内部不相交的多边形。本文介绍了几何k-切割问题,该问题旨在计算平面上基于颜色的成对不相交对象的最短“围栏”。作者提出了一个多项式时间算法,用于两个颜色情况,并提出了一个随机近似算法,用于多个颜色情况。与我们最接近的研究是Rottmann等(2025)提出的多边形聚合方法,该方法利用图切割生成基于面积-周长权衡的最优解。该方法通过从多边形的外部选择一组三角形来合并输入多边形。三角形的选择由一个结合输出多边形面积和周长的双标准优化模型控制。该方法与α-形状进行了比较,显示出双标准形状随着输出多边形周长的减少,视觉复杂度单调递减。在此基础上,Beines等(2025)引入了参数广度优先搜索(PBFS),这是一种解决参数最小切割问题的新算法。与之前的方法不同,PBFS以升序发现断点,同时保持最优渐近运行时间,提高实际性能。值得注意的是,PBFS在大规模实例上表现出色,能够处理数百万个多边形,并在几秒钟内计算所有断点,显示出优于现有方法的可扩展性。
### 4. 研究区域和数据
#### 4.1. 研究区域
本文重点研究的区域位于德国西部的北莱茵-威斯特法伦州(纬度:50.32°N-52.49°N,经度:5.99°E-9.21°E)。所提出的的方法被精心应用于该区域的七个不同的子区域。图6展示了这些划定区域的视觉表示,以及表2中的详细描述。在表2中,“标签”表示研究区域的编号,如图6所示,而“名称”指的是子区域所在的城市名称。表中还表示了研究区域的总面积、森林面积和其他土地覆盖类别的面积,基于ESRI土地覆盖地图(见第4.2.1节)。
#### 4.2. 数据描述
本研究使用了三个主要数据集:1)ESRI土地覆盖地图,2)OSM,3)ATKIS Basis-DLM。ESRI和OSM被用作实现所提出方法的输入数据集,而ATKIS Basis-DLM数据集被用作验证结果的参考数据集。这些数据集的关键属性在表3中详细描述,并在以下简要介绍中概述。
##### 4.2.1. ESRI土地覆盖产品
ESRI土地覆盖数据集是地球地表每年的土地覆盖地图,涵盖2017年至2022年。该数据集由ESRI于2021年6月发布,用于全球LULC的国家和地方尺度映射(Chaaban等,2022)。ESRI的地图主要使用ESA Sentinel-2 Level 2A产品集合,空间分辨率为10米。Sentinel-2在可见光和红外光谱中捕捉反射图像,其中六个通道用于LULC分类:蓝、绿、红、近红外和两个短波红外(Huan, 2022)。使用人工智能深度学习算法对数据集进行分类,生成了九个不同的土地覆盖类别:水、树木、被水淹没的植被、农作物、建成区、裸地、冰/雪、云和草地(ESRI, 2023)(Zhang等,2023)。本研究使用了2022年的ESRI土地覆盖地图。对应的地图空间分辨率为10米,以栅格GeoTIFF格式提供(ESRI, 2023)。
##### 4.2.2. OpenStreetMap(OSM)
OSM(2024)由Steve Coast于2004年发起,作为对英国国家测绘机构Ordnance Survey的回应。OSM是一个协作测绘项目,专注于提供全球地理信息的数据库,适用于导航、地理分析、城市规划等多个领域(Neis和Zielstra, 2014)。数据在商业和非商业用途下免费,依据“开放数据库许可(ODbL)1.0”,这意味着用户可以自由共享、修改和使用数据,前提是结果产品具有相同的自由度(Dorn等,2015)。在本研究中,OSM数据通过Geofabrik咨询和软件开发公司的下载服务器收集,参考日期为2023年6月19日。该公司专门提供OSM服务,处理原始数据以使其适用于专业项目。Geofabrik提供免费下载的区域OSM原始数据以及以shapefile形式提供的选定数据。我们使用了包含21种不同土地覆盖类别的‘gis-osm-landuse’图层进行实验。
##### 4.2.3. ATKIS Basis-DLM
为了使用IoU和Hausdorff距离度量评估我们结果的空间准确性,我们使用了官方地形制图信息系统(ATKIS)的基本数字景观模型(Basis-DLM)作为参考数据集。ATKIS提供详细的地形信息,包括高程、土地覆盖、交通网络、水文和行政边界。ATKIS的一个关键特点是其面向对象的数据模型,该模型将现实世界特征表示为具有相关属性的对象,从而提供丰富而灵活的景观表示。在德国北莱茵-威斯特法伦州,Basis-DLM基于数字正射影像、实地调查和地形信息定期更新,提供高位置准确性(±3米)。所使用的版本反映了截至2023年7月31日的更新,并且对应于1:25,000的地图比例,通常有三年的更新周期,但像道路和铁路这样的特征有更短的更新间隔。所有数据都参考ETRS89/UTM区域32N坐标系统。在验证过程中,我们专注于对象类型‘AX_Wald’,该类型定义了被树木和灌木覆盖的区域,这与我们研究的森林土地覆盖相一致。尽管Basis-DLM排除了小于0.1公顷的森林区域(Laggner, 2016),但其准确性、更新频率和权威性使其成为验证我们结果的可靠基准。
### 5. 结果
为了提高研究结果的清晰度,我们将本节分为两个子部分:数据集的预处理(第5.1节)和训练区域中优化模型参数的估计(第5.2节)。第6节展示了所提出方法在测试区域中的性能,以及该方法在LULC提取方面的评估。
#### 5.1. 数据集的预处理
最初,数据被转换为统一的坐标系统和相应的投影。ESRI和OSM数据集最初参考WGS84。然而,用于验证结果的ATKIS Basis-DLM数据集是ETRS89/UTM区域32N,这是德国地籍测绘的标准投影。为了确保一致性和便于计算多边形的面积和周长,输入数据集被转换为ETRS89/UTM区域32N投影。在协调输入数据集之后,ESRI的LULC地图被转换为向量数据。为了减少由像素网格引起的多边形边缘的噪声,对转换后的像素地图进行平滑处理。平滑过程使用了与初始LULC地图像素大小相匹配的10米阈值。图6(a)展示了从ESRI像素级数据集向量化步骤中提取的多边形的平滑效果。鉴于对‘森林’土地覆盖类别的关注,从ESRI数据集中选择的多边形类别包括‘树木’,而从OSM数据集中选择的多边形类别包括‘森林’、‘公园’和‘自然保护区’(参见表3),这些类别对应于被树木覆盖的自然或自然类似区域。
图6(b)展示了使用ESRI数据集作为D1(黄色多边形)和OSM数据集作为D2(蓝色多边形)的小样本区域叠加结果。在图中,两个数据集之间的重叠区域,形成新的多边形作为独立实体(D1,2,灰色多边形),被突出显示。原始ESRI和OSM多边形在交界区域的调整边界分别显示为黄色和蓝色。
下一步是对叠加数据集进行三角剖分。为此,我们使用Java程序库“JTS Topology Suite”中的“Densifier”类在多边形边界上插入额外的节点。距离容差定义了多边形上两个连续节点之间的最大距离。如果超过该距离,则插入新节点,直到最大距离得到维持。在本研究中,使用100米的距离容差生成了足够良好的三角形,以处理测试数据。图7展示了在添加额外节点前(图7(a))和后(图7(b))D1,2数据集的CDT结果。灰色三角形在两个数据集中都存在,黄色三角形仅存在于ESRI(D1)多边形中,蓝色三角形仅存在于OSM(D2)多边形中。
#### 5.2. 优化模型参数的调整
优化模型的参数是在训练区域中逐步确定的。在本研究中,Herchen(图5中的R7)被选为训练研究区域,参数在该区域中进行校准和调整。
参数的计算首先从λ开始,它是一个平衡因子,用于调节三角形的面积和周长之间的权衡。在这一步骤中,α、β、γ和δ四个参数被分别设置为1。图8(a)展示了在训练研究区域Herchen中确定的IoU作为λ值的函数,计算使用描述的算法,导致解决方案集。由于在所选比例(考虑大面积)下,周长表现得线性,而面积表现得二次,大多数导致不同解决方案的λ值都接近0。最大的IoU值0.8319在λ=0.162时实现(见图8(b))。因此,参数λ被设置为0.162用于进一步的实验。
在图8(a)中,IoU作为λ∈[0,1]的函数被计算,其中α、β、δ和γ=1。在图8(b)中,IoU作为λ∈[0,0.3]的函数被计算,其中λ=0.162。图8(a)显示了λ∈[0,1],而图8(b)显示了λ∈[0,0.3]。
根据第3节的描述,参数α表示ESRI(D1)中仅存在于ESRI的三角形的面积成本因子。通过将α=1设置为这些三角形的权重,它们与未被分类为‘森林’的任何数据集中的三角形权重相等。同样,当β=0时,OSM中仅存在的三角形不会产生面积成本,使它们在减少周长时更受青睐。由于‘森林’类在OSM和ATKIS Basis-DLM参考数据集之间具有更高的准确性和假设的相似性,OSM多边形比ESRI多边形更接近ATKIS Basis-DLM多边形。这种相关性可以归因于OSM和ATKIS Basis-DLM都使用的详细分类标准,这些标准确保了对森林区域更精确的表示。因此,为了使几何谐波与ATKIS Basis-DLM保持一致,仅存在于ESRI LULC的三角形对增加目标函数贡献更多,其中α=1和β=0。
与确定α和β的过程类似,成本因子δ和γ也被确定。根据图9(b),在训练数据集上,最大IoU出现在γ=0.5和δ=0.3时,导致它们的相应参数值。参数δ和γ作为成本因子,确保谐波多边形紧密遵循ESRI(D1)和OSM(D2)的多边形边界。
估算的γ和δ值意味着遵循OSM多边形边界的成本因子小于遵循ESRI多边形边界的成本因子。然而,这两个因子都小于1,表明在几何谐波中对输入数据集的多边形边界有一般性偏好。
在训练区域中,ESRI和OSM的LULC数据集的IoU分别为0.7742和0.8457。在该区域中,D1和D2与参考数据集之间的Hausdorff距离分别为443.115米和775.861米。
图10展示了本研究中提出的LULC融合方法(GH-LULC)在训练区域Herchen中的LULC输出,用红色多边形表示,叠加在Herchen的训练区域上。ATKIS Basis-DLM用蓝色表示,作为比较的参考图层。在该训练区域中,ESRI和OSM的LULC数据集与参考图层的IoU得分分别为0.7742和0.8457。此外,D1和D2与参考数据集之间的Hausdorff距离分别为443.115米和775.861米。这些指标突显了输入数据集与参考标准之间的初始空间差异。
图10展示了训练区域(Herchen)的几何谐波,用红色多边形表示,使用模型中的最佳参数进行调整,与用蓝色表示的ATKIS Basis-DLM进行对比。在该训练区域中,ESRI和OSM的LULC数据集与参考图层的IoU得分分别为0.7742和0.8457。此外,D1和D2与参考数据集之间的Hausdorff距离分别为443.115米和775.861米。这些指标突显了输入数据集与参考标准之间的初始空间差异。
在对模型参数进行微调(λ=0.162;α=1;β=0;γ=0.5;δ=0.3)后,GH-LULC输出与参考数据集之间的IoU和Hausdorff距离显著提高,分别达到0.8615和404.528米。这表明几何谐波过程有效地将GH-LULC地图与参考的ATKIS Basis-DLM对齐,超越了个体ESRI和OSM数据集的性能。
结果表明,GH-LULC框架在训练区域中不仅在与输入数据集相比时实现了更高的IoU,而且在通过Hausdorff距离衡量的空间差异方面减少了。这表明通过在我们的模型中应用优化的参数并选择最适合最大化几何谐波的三角形,输出地图在边界准确性和整体几何上与参考数据非常相似。此外,这一过程使GH-LULC能够更新之前的LULC地图,提高其光谱和属性准确性,有效地反映LULC的变化。最终的GH-LULC地图提供了更精确和可靠的区域表示,与权威的ATKIS Basis-DLM对齐,并为需要准确LULC信息的各种应用提供了改进的实用性。
### 6. 测试区域中的方法评估和讨论
所提出的方法用于森林区域的LULC开发和几何谐波,在六个测试区域中进行,如图5所示,详细说明在表2中。
表4展示了所有测试区域中确定的IoU和Hausdorff距离值。这些值是针对输入数据集和输出GH-LULC计算的,并与ATKIS Basis-DLM进行比较。需要注意的是,IoU作为多标准优化方法参数训练的主要标准,是我们主要的质量度量。IoU衡量预测和参考LULC多边形之间的重叠,提供了谐波与参考数据集对齐程度的稳健指标。然而,除了IoU之外,我们还考虑了Hausdorff距离作为次要标准。Hausdorff距离提供了互补的视角,通过评估预测和参考多边形边界的距离,帮助评估谐波过程的几何准确性。所有测试区域中确定的IoU和Hausdorff距离值在图11中以视觉方式表示。
图11展示了六个测试区域的IoU和Hausdorff距离(DH),计算了GH-LULC、ESRI和OSM,与ATKIS Basis-DLM进行比较。在图中,IoU作为主要质量指标,是训练多标准优化方法参数的关键标准。Hausdorff距离作为次要标准,提供了评估预测和参考多边形边界的距离,帮助评估谐波过程的几何准确性。所有测试区域中确定的IoU和Hausdorff距离值在图11中以视觉方式表示。
根据表4,RS基础的ESRI LULC数据集在测试区域中表现出最低的IoU值,平均IoU约为0.72。这表明,在没有几何谐波的情况下,RS基础的产品与参考数据的对齐度较低,尤其是在Overath和科隆(图5)等具有复杂土地覆盖特征的区域。相比之下,OSM数据集表现出更高的IoU,平均值为0.830,表明其与参考数据的初始对齐度更好。这一更高的对齐度在Eitorf、Windeck、Kall和波恩等区域尤为明显,其中OSM的IoU值分别为0.896、0.940、0.867和0.885。
根据表4,所提出几何谐波方法的应用显著提高了从RS基础的ESRI数据集生成的LULC地图的准确性,如在所有测试区域中IoU值的增加所证明的。在Windeck、Overath和科隆区域中,观察到最显著的改进。在应用