基于分层自适应特征的高分辨率不透水面自动映射
《Science of Remote Sensing》:Automatic Mapping of High-Resolution Impervious Surfaces Driven by Hierarchical Adaptive Features
【字体:
大
中
小
】
时间:2025年10月11日
来源:Science of Remote Sensing 5.2
编辑推荐:
中国石油大学(华东)学者提出基于Google Earth Engine的分层自适应特征框架,通过引入Phenology-Enhanced Vegetation Index(PEVI)优化自动样本生成,结合多尺度卷积神经网络提取区域异质性特征,成功构建2016-2023年印度支那半岛5米分辨率不透水表面动态监测数据集ICPIS,整体准确率达91.32%,显著优于现有中低分辨率数据集。
在东南亚地区,尤其是中南半岛,城市化带来的不透水面扩张已成为影响生态环境和社会发展的重大挑战。不透水面指的是那些阻止水渗透到土壤的人工结构,如道路、停车场和建筑物。随着城市化进程的加速,这些人工结构逐渐取代了原本的自然景观,特别是在像中南半岛这样的快速发展的区域。这种转变不仅改变了土地的物理和化学特性,还引发了诸如城市热岛效应、地表径流增加和生物多样性下降等一系列环境问题。因此,开发能够有效监测不透水面动态的大规模、多时相数据集对于保障人类社会和自然生态系统的长期可持续发展至关重要。
随着遥感技术的不断进步,尤其是云计算平台如Google Earth Engine(GEE)的广泛应用,无缝的区域和全球土地覆盖及不透水面数据集的构建正在经历革命性的变化。Landsat数据以其40年的中分辨率(30米)多光谱影像,支持了多个数据集的生产与更新,如全球不透水面(GISA 2.0)、全球不透水面动态(GISD)和GlobeLand30。更近的Sentinel-2卫星则提供了10米空间分辨率的多光谱影像,进一步提高了土地覆盖监测的精度。全球人工不透水面(GAIA)、10米全球不透水面面积(GISA-10m)和欧洲空间局世界覆盖(ESA WorldCover)等数据集在热带地区云覆盖频繁和降雨量大的背景下,显示出其在多源数据融合方面的优势,尤其在整合光学和合成孔径雷达(SAR)数据方面。
然而,在发展相对滞后的地区,如中南半岛,现有的数据集在不透水面监测中面临诸多挑战,其中最为突出的是系统性的四舍五入误差。这些误差通常出现在使用较粗粒度像素表示真实地表特征时。由于传感器的固有局限性,碎片化和复杂的地表特征在中低分辨率影像中往往被掩盖或归类为更粗略的类别。在这一过程中,空间分辨率决定了传感器对小目标的检测能力,而时间分辨率则影响长期监测的一致性。然而,中南半岛普遍的云覆盖和频繁的降雨往往需要在这两个维度之间进行权衡,提高一个通常会牺牲另一个。
为了解决这一问题,研究者提出了一种基于高分辨率影像的快速准确的大规模不透水面测绘方法,该方法在多个方面做出了创新贡献。首先,引入了一种新的基于物候信息的植被指数(PEVI),以减少从现有数据集中自动提取样本时的噪声,从而实现去人工化的样本训练。其次,设计了一个将GEE与多尺度、基于块的卷积神经网络(CNN)相结合的框架,以在分层策略下提取具有上下文适应性的特征,支持在城市和非城市区域内的专门训练和预测。最后,将该方法应用于中南半岛,开发了首个具有5米分辨率和覆盖2016至2023年期间的不透水面数据集,命名为ICPIS。通过多维度的比较分析和精度评估,ICPIS在减轻空间和时间四舍五入误差方面展现出显著的优势,突显了其在大规模应用中的潜力。
在方法论方面,该研究框架由四个关键步骤组成:遥感影像处理、自动训练样本收集、分层自适应特征提取以及分类和后处理。为了有效提取不透水面,研究团队提出了一种两阶段策略,结合深度学习和GEE上的大规模预测。在第一阶段,通过分层训练基于块的CNN,将它们的卷积核转化为自适应空间特征提取器。在第二阶段,将训练好的卷积核应用于整个研究区域,生成特征图。这些特征,包括光谱和雷达特征,随后输入到随机森林分类器中,负责最终的分类任务。
在自动训练样本收集过程中,研究团队采用了一种基于PEVI的噪声抑制方法。传统上,数据驱动的土地覆盖测绘依赖于大量高质量的训练样本。从现有数据集中自动提取样本是大规模应用中最实用的方法之一。为此,研究团队首先叠加了多个现有的土地覆盖数据集,包括ESA WorldCover 2021、Esri Land Cover 2021、Dynamic World 2021、GAIA 2021等,取它们的并集以确定潜在的不透水面范围。在中南半岛,这些数据集的一个主要问题是频繁将住宅植被误分类为不透水面。研究团队发现,植被指数的时间序列标准差可以有效捕捉研究区域中植被的强烈季节性变化。基于此,他们提出了PEVI,以有效和稳健地抑制噪声。在本研究中,PEVI由Planet NICFI数据中的NDVI构成,而时间序列NDVI则由Sentinel-2影像计算得出。研究团队利用高时间频率的Sentinel-2数据捕捉植被动态,同时利用Planet NICFI数据确保PEVI的细节与目标的5米分辨率相匹配。在确定数据源后,研究团队设置了一个经验值,以确保这两个组件之间的权重具有可比性。
此外,研究团队还提出了一种空间分层的样本获取策略,以独立收集训练样本并为不同地理区域构建分类模型。首先,研究区域被划分为城市区域(GUB面积≥100平方公里)和非城市区域(其他)。在城市区域,不透水面密集且连续分布,因此采用随机采样策略提取了60,000个样本(包括30,000个不透水面和30,000个非不透水面),用于训练一个区域特定的CNN。从这些样本中,进一步随机选取了5,000个不透水面和6,000个非不透水面样本,用于在GEE上训练随机森林分类器以进行城市测绘。在非城市区域,由于不透水面特征稀疏,因此采用了空间受限的采样策略以平衡样本分布并减少空间自相关性。考虑到采样率和代表性的权衡,研究区域被划分为1,005个0.5°×0.5°的网格。然后,在每个网格内进行均匀采样,总共提取了100,000个样本(包括50,000个不透水面和50,000个非不透水面)用于CNN训练。从这些样本中,随机选取了12,000个不透水面和15,000个非不透水面样本,用于训练非城市区域的随机森林模型。样本数量的确定参考了现有大规模土地覆盖和不透水面测绘研究。研究团队需要足够大的样本集以确保地理代表性,同时也要考虑在GEE上数据收集的实践效率。
此外,为了增强道路的界定,研究团队整合了OpenStreetMap的辅助数据。考虑到影像的约5米空间分辨率,研究团队仅关注较宽的道路类型(如主干道、次干道、高速公路、快速路和三级道路)。采样点随机分布在道路中心线上,产生了8,000个额外样本用于CNN训练,其中2,000个样本被分配到随机森林的训练集中。通过这种方式,研究团队不仅能够准确识别道路,还能确保样本的多样性。
在分层自适应特征提取方面,研究团队设计了一种多尺度特征提取策略,以增强在空间特征提取过程中对区域异质性的适应性。传统的固定参数空间特征(如熵、逆差分矩)作为通用描述符,旨在适用于各种场景,但难以捕捉特定目标在不同情境下的变化。相比之下,CNN能够根据输入数据的特性动态调整其参数,通过卷积提取依赖于上下文、任务特定的特征。因此,研究团队设计了一种多尺度基于块的CNN,以在空间特征提取过程中提高对区域异质性的适应性。该架构在已建立的分层框架内运行,其中针对城市和非城市区域分别独立构建和训练特定的CNN。每个模型使用其对应区域的样本集进行训练。每个CNN通过在不同接收场的多个层次中并行整合信息,使上下文像素能够从多个尺度上影响中心像素的类别。这种方法优化了特征的区域特异性,从而提高了模型在大规模异质环境中的鲁棒性。
在确定CNN的参数配置时,研究团队考虑了不同区域的特点。在城市区域,较小的块(如5×5和7×7)能够捕捉到局部几何特征,如道路边缘和建筑物角落,而较大的块(如9×9和11×11)则能够捕捉目标的宏观轮廓和空间组织。在非城市区域,3×3和5×5的块专注于道路的线性结构和孤立建筑物的简单几何特征。同时,9×9的块在建模不透水面与周围农田或植被的空间关系方面更为有效,以及捕捉植被和水体的连续分布模式。研究团队采用了一致的3×3卷积核,应用于每个输入块的有效区域。这种做法确保了上下文信息能够准确映射到中心像素。计算过程可以描述如下,其中每个块的尺寸为3、5、9,适用于非城市区域;而在城市区域,块的尺寸则为5、7、9、11。通过这种方式,研究团队确保了CNN在不同区域中的适应性。
在分类和后处理阶段,研究团队利用了随机森林模型,分别对城市和非城市区域进行不透水面测绘。为了确保分类结果的稳定性,研究团队采用了一种时间一致性检查方法,以减少因独立分类可能产生的伪变化。首先,通过时间过滤增强相邻年份的分类稳定性。随后,纠正了不合理的地表覆盖变化,基于不透水面在短时间尺度上不会转变为其他地表覆盖的假设。经过这些操作,最终形成了ICPIS数据集。为了验证ICPIS的精度,研究团队采用了一种分层采样策略,从城市和非城市区域中选取具有代表性的不透水面和非不透水面样本。在城市区域,样本是随机选取的;而在非城市区域,采用了一种空间受限的采样方法(基于2°×2°的网格)。研究团队利用Google Earth的历史影像和Planet NICFI的中位数合成影像完成了样本的视觉解释。总共获得了2016年的4,017个样本和2023年的4,181个样本,其空间分布如图6所示。最终,通过混淆矩阵计算了总体精度(OA)、Kappa系数、用户精度(UA)和生产者精度(PA),以验证ICPIS的性能。
从结果来看,ICPIS在城市和非城市区域均表现出色,总体精度达到90.69%和91.32%,Kappa系数分别为0.813和0.826。在城市区域,OA和Kappa系数均超过91%和0.820,而在低密度或碎片化的非城市区域,OA和Kappa系数也分别超过90%和0.8。这一结果表明,ICPIS在复杂地表环境下的分类能力得到了显著提升,特别是在识别稀疏分布的目标和反映边界区域的复杂过渡方面。此外,ICPIS的高分辨率使其能够有效捕捉不透水面的细微变化,如道路和孤立建筑物,这在传统低分辨率数据集中往往难以实现。
在与现有高分辨率数据集的比较中,ICPIS展现出显著的优势。例如,GHS BUILT S2在2018年的总体精度仅为71.18%,Kappa系数低于0.424,虽然其用户精度达到90.06%,但生产者精度仅为47.66%,表明其存在严重的低估问题。相比之下,ICPIS的总体精度和Kappa系数明显更高,这得益于其对空间细节的更精确表达和对四舍五入误差的最小化。在非城市区域,GAIA和GISA 2.0由于其30米分辨率,经常将大面积的裸地和稀疏植被误分类为不透水面,导致其检测到的不透水面面积是ICPIS的1.20到2.05倍。此外,这些数据集在时间一致性方面存在不足,尤其是在低密度聚居地和城乡过渡区,导致分类结果不稳定,甚至出现异常的负增长。
在与传统纹理特征的比较中,研究团队发现CNN方法在捕捉复杂场景中的空间上下文和分层模式方面优于传统的灰度共生矩阵(GLCM)方法。GLCM特征对尺度和方向的变化响应较弱,且其预定义的特性限制了其在区分细小目标方面的灵活性。例如,它们往往无法有效识别不透水面内的小植被。相比之下,基于CNN的方法利用其深层、分层的架构,自动学习和整合多尺度空间信息,使其对局部细节(如植被与不透水面的交界)更加敏感,并能更好地理解广阔空间场景中的上下文安排。更重要的是,CNN特征通过数据驱动的训练优化,使其在遇到新或多样化纹理类型时具有更强的泛化能力。因此,结合GEE平台的多尺度基于块的CNN与随机森林算法,能够更高效地捕捉大规模复杂空间关系,并在各种纹理环境中提供更高的精度和鲁棒性。
在讨论部分,研究团队还探讨了参数确定的问题。在PEVI中,系数用于调整瞬时光谱状态与年度物候特征之间的相对重要性。为了找到最佳平衡,研究团队将分割阈值固定在0,并测试了系数从1到10对植被与非植被分割的影响。如图12(a)所示,当系数为5时,不透水面的F1分数达到峰值0.812,因此确定系数为5以确保PEVI能最有效地整合瞬时状态与物候特征。为了确定PEVI的最佳阈值,研究团队测试了从-0.5到0.5的阈值,步长为0.1。在每个阈值下生成的植被掩膜被应用于完整的流程,以获得每个阈值下的最终总体精度。比较的基线样本来自多个现有产品的并集或交集。如图12(b)所示,基于PEVI的去噪显著提高了样本质量和最终精度。分类性能在阈值约为0.22时达到峰值,总体精度为91.36%。研究团队还发现样本质量与最终精度之间存在显著的正相关关系。然而,如果PEVI阈值设置过于激进,样本集可能会因过度过滤而失去代表性,导致精度下降,尽管样本纯度较高。因此,选定的阈值0.22代表了有效去噪和保持样本代表性的最佳平衡。
在确定CNN的最佳块配置时,研究团队发现对于非城市区域,其相对简单的地表覆盖在块配置为{3, 5, 9}时,总体精度已接近饱和点,约为90.71%。由于进一步增加分支数量或块尺寸带来的性能提升有限,因此选择了更为简洁和高效的配置。相比之下,城市区域由于结构复杂,模型的初始精度较低,但随着模型复杂度的增加,精度持续提升。最终,研究团队选择了{5, 7, 9, 11}的块配置,因为该配置在GEE平台上实现了最高的总体精度(92.71%),同时接近计算能力的极限。这代表了性能与计算成本之间的最佳平衡。
在结论部分,研究团队指出,现有的覆盖中南半岛的多时相不透水面数据集存在四舍五入误差,这导致了城市扩张监测结论的不确定性。为此,本研究提出了一种基于高分辨率影像(如NICFI)的大规模不透水面提取框架。该框架引入了PEVI,通过利用物候信息来提升分割性能,有效减少了自动采样中的噪声。随后,采用多尺度CNN来分层提取自适应特征,优化了城市和非城市区域的测绘精度和平衡。最终,该框架部署在GEE上,使得大规模不透水面数据集的生成更加可扩展、自动化和高效。
通过这一框架,研究团队开发了中南半岛首个具有5米分辨率和覆盖2016至2023年期间的不透水面数据集,即ICPIS。精度验证结果表明,2016年的总体精度为90.48%,2023年为90.65%,Kappa系数分别为0.809和0.813。与现有的高分辨率数据集相比,ICPIS能够有效捕捉小尺度特征,如城市道路和单体建筑。此外,ICPIS在反映中南半岛不透水面动态扩张方面显著优于当前的多时相数据集,特别是在界定聚居地边界和城市扩张方面。值得注意的是,ICPIS作为区域产品,其优势源于针对中南半岛地理特点的专门设计。与追求普适性的全球产品相比,ICPIS的模型和训练数据经过优化,使其在捕捉复杂本地土地特征方面具有根本性的优势。
尽管研究团队在本研究中取得了一定的成果,但仍存在一些局限性。首先,数据集的年度更新频率限制了其捕捉不透水面短期动态变化的能力。其次,GEE平台存在一定的用户资源限制。例如,研究团队选定的{5, 7, 9, 11}块配置已经接近平台的计算上限,可能限制了模型性能的进一步提升。第三,由于地理可达性的限制,偏远地区的地面实况验证样本稀缺,这在一定程度上限制了在复杂地表条件下对模型性能的系统评估。最后,研究团队采用了现有时间序列研究中常见的后处理程序,假设不透水面仅会扩张以确保逻辑一致性。然而,这种简化忽略了诸如建筑拆除等事件,尽管这些事件在比例上相对较少。尽管存在这些限制,本研究通过提供一种新的大规模不透水面动态监测参考框架,做出了开创性的贡献。未来的研究将重点放在整合高时间分辨率的序列数据、优化深度学习框架的计算效率和可扩展性,以及将社会经济和生态因素纳入考虑,以提供更全面的科学支持,助力中南半岛的可持续城市化进程。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号