《ISPRS International Journal of Geo-Information》:A Low-Fragmentation Global Vector Dataset for River and Lake Classification of Surface Water Bodies
编辑推荐:
本文提出了一种基于JRC全球地表水数据集(GSW)的低碎片化全球河流与湖泊分类矢量数据集(GSWCVD v1.0)构建方法。研究通过三阶段渐进式聚合策略(基于水文网络约束、分类缓冲区和邻域分析)有效降低了矢量化过程中的水体碎片化(减少近60%),并开发了一种结合卷积神经网络(CNN)局部特征提取与Transformer全局上下文推理的混合深度学习分类器(HCTC),对水体进行子类型分类,F1分数达92.4%。该研究为从遥感栅格产品中提取和构建具有对象级语义信息的全球地表水分类矢量数据集提供了可转移的解决方案,对水文建模、环境监测和水资源管理具有重要意义。
全球范围内,精确分类的地表水数据集对于水文建模、环境监测和水资源管理至关重要。现有的大尺度数据集多为基于像素级分类的栅格数据,而现有的全球矢量数据集往往难以捕捉小型水体并保持全球一致性。因此,从地球观测栅格产品中提取矢量特征并进行细粒度分类是一种有前景的方法,但碎片化以及缺乏对象级语义标签仍是关键挑战。
1. 引言
地表水体是支持生态系统、水资源评估和环境评价的关键地表覆盖类型和特征。高质量的地表水体数据不仅为理解全球水资源现状提供支持,也是水文模拟与预测、灾害预警与评估、水体监测与管理、生态系统保护与恢复等多个领域模型构建的关键输入。气候变化、快速城市化、人口增长和环境退化等因素导致全球水资源逐渐减少,从而加强了研究人员对具有高空间和语义粒度的全球尺度地表水体数据集的需求。
目前,全球地表水数据集主要来源于遥感,并以栅格格式存在,这是像素分类的直接输出。栅格数据由于其易于处理和存储,被广泛应用于对地观测。然而,在某些场景下,如水文网络和拓扑关系分析,以及基于GIS的空间分析中,具有清晰拓扑结构、高几何精度并能存储属性信息的矢量数据是首选。栅格数据不可避免地存储背景信息,且难以在对象层面进行管理,从而对存储和分析都构成挑战。对于地表水数据集,基于矢量的数据具有水体边界清晰、易于动态更新以及能够包含语义标签等优势,对于精细尺度的水文和水资源工作至关重要。
现有的全球地表水矢量数据集,如HydroRivers和HydroLakes,主要源自HydroSHEDS(一个分辨率为500米的栅格数据集,且缺乏北纬60°以上的覆盖)。SRTM水体数据具有更高的位置精度,但仅限于南纬56°至北纬60°之间的纬度。GRNWRZ V2.0采用有效的分区和编码方法,基于SRTM和ASTER GDEM数据生成多级河网,但仅包含河流,排除了其他类型的水体。
现有的地表水矢量数据集在覆盖范围、空间分辨率、更新频率以及小型水体的表示方面面临挑战。这些局限性凸显了通过矢量化从高分辨率遥感产品中提取和分类地表水体的必要性。然而,此过程仍存在两大挑战:(1)提取过程不可避免地引入大量碎片化的水体特征,例如断开的狭窄河流碎片、宽阔河流和湖泊边缘碎片以及孤立碎片,这些碎片会因连通性中断和计算成本增加而阻碍后续分析;(2)从栅格数据中提取的矢量特征缺乏对象级语义信息,限制了其分类和解释的价值。
这些碎片化的水体通常难以通过传统算法完全识别和整合,从而影响分类质量以及下游模型的可靠性。现有的解决水体碎片化和子类型分类的研究主要包括基于规则的方法、面向对象的分割和深度学习方法。虽然在特定区域通过水文建模和基于高分辨率影像的方法取得了一些成功,但大多数方法要么缺乏全球尺度的可扩展性,要么受限于计算效率低下和在数据稀缺区域性能不足。此外,很少有研究系统地在分类之前解决碎片化水体的结构重建问题,尤其是在处理河流碎片和孤立微碎片时。
为了解决这些问题,本研究提出并实施了一个用于后处理地表水影像数据集的集成方法框架,并开发了一个全球尺度的地表水水体分类矢量数据集。
2. 相关工作
2.1. 去碎片化策略
碎片化是全球地表水制图中的常见问题。在许多卫星衍生的地表水数据集中,连续的水系常常被错误地表示为大量不连接的独立斑块,尤其是在狭窄河网、三角洲、河湖连接处和干旱区域。不连续的像素分类结果会在矢量化过程中导致严重的碎片化水体问题。
除了少量真实的地表小型水体外,大多数碎片源于遥感识别过程中的误差。原因主要涉及物理机制和技术限制。物理机制包括部分水体显著的季节性水位变化、卫星成像时的阴影遮挡、以及高浊度水体具有与陆地相似的红外反射率等。技术限制主要指图像分割算法的缺陷和混合像元效应。许多方法被提出来解决地表水碎片化问题。例如,基于碎片面积动态调整卷积核大小,或基于高置信度水像素和光谱相似性阈值合并碎片,但这些方法难以处理复杂的边界情况。使用基于特定结构的深度学习网络实现多尺度信息融合以增强水体分割,在复杂地形下的水体识别精度显著提高,但该方法严重依赖高分辨率遥感图像。结合数字高程模型(DEM)和水文分析来判断碎片化水体是否同源,可以有效恢复被桥梁、水坝等基础设施切断的水体,但该方法缺乏普适性。基于水体特征改进水存在阈值,考虑实际历史水分布数据与待处理数据之间的差异,并结合水体特征进行判断,该方法精度高且精度与计算成本比优良,具有广泛应用潜力,但在时间尺度上存在显著局限性且依赖真实数据。使用多源遥感图像和像素级数据融合,结合半经验阈值生成地表水体范围,能有效消除云覆盖图像的影响,并在许多复杂区域表现良好。然而,对于土壤反射率低的区域,如某些区域的休耕农田和冲积带,以及缺乏验证点的沙漠地区,该方法可能将非水像素误分类为水,导致高误报率。
总体而言,现有方法存在一定局限性,几乎所有方法在扩展到全球范围时都面临关键限制。物理/水文方法依赖额外的高质量辅助数据集,这些数据在全球尺度上要么不可用,要么不一致,导致性能不稳定。形态学图像处理方法容易改变水体的形状,直接影响分类结果。而深度学习驱动的多尺度融合方法则显著增加计算成本。因此,在进行全球尺度的水体去碎片化时,我们倾向于从更基础的视角进行分析,基于地理知识的约束和分层处理方法可能在成本效益方面具有优势。通过空间分析,基于碎片化水体的空间分布模式开发聚合策略,对于减轻其对分类结果的负面影响至关重要。
2.2. 水体子分类
在遥感水体分类领域,当前研究主要集中在两个方向:基于阈值的分类方法和基于机器学习及深度学习的分类方法。早期从遥感图像中区分水体子类的努力主要依赖于人工目视解译和历史数据。然而,这些方法效率低下,且难以在缺乏历史数据的区域应用。一些基于规则的方法使用几何特征和经验定义的阈值进行自动分类,但其参数在不同传感器和区域间缺乏普适性。此外,这些方法在处理相连的水体区域时精度较低。
机器学习和深度学习技术在图像分析和模式识别领域的兴起显著推动了水体分类的进展,使数据驱动方法成为水体分类研究的主流路径。在这些方法中,卷积神经网络(CNN)得到了广泛应用。例如,基于CNN和编码器-解码器架构的MRSE-Net展示了强大的特征提取能力。通过引入SE注意力机制,它极大地增强了水体边界的连续性,并在使用Landsat和Sentinel等多源遥感图像的水体分类任务中实现了超过90%的平均准确率。W-Net是一种基于CNN的端到端多特征融合结构,通过收缩网络捕获上下文信息,仅用2000个训练样本就实现了89%的IoU精度。许多研究表明,整合各种形态特征数据并优化模型架构可以显著提高水体分类模型在复杂场景下的识别能力和泛化性能。最近,也有基于形状和形态学方法的地表水体提取和分类研究,并取得了有希望的结果。例如,有研究采用数学形态学算子和无监督方法从单波段中提取地表水体,取得了令人满意的结果。这充分表明,仅轮廓信息就为水体分类任务提供了足够的信息。
总体而言,很少有研究关注使用更通用的规则来处理碎片化水体。虽然许多基于CNN的方法被提出用于水体分类,但很少有研究将其应用于全球尺度的水体子分类任务。更少有研究在一个统一的框架内系统性地解决碎片化和子类标签相结合的挑战。
3. 材料与方法
本研究使用的源数据是JRC全球地表水(GSW)数据集,具体而言,我们使用了JRC全球地表水制图图层v1.4范围数据产品。此外,GRNWRZ V2.0全球河网数据集被用作辅助数据,对于某些区域,Landsat 8影像被用作人工水体类型标注的参考。在从栅格数据提取矢量的过程中,我们应用了经典的Douglas-Peucker算法进行边缘简化,以减少矢量特征中的顶点冗余。使用的深度学习分类器是结合了CNN和Transformer的混合架构。最后,部分人工标注数据和某些区域的OSM数据被用作分类结果基准测试的标准。
3.1. 源数据与预处理
JRC全球地表水(GSW)数据集是使用最广泛的全球地表水遥感数据产品之一。它由欧盟委员会联合研究中心(JRC)基于Landsat系列卫星影像开发,时间跨度覆盖34年(1987年至2020年),空间分辨率为30米。该数据集提供多个产品,包括年度分类、出现频率和季节性指数,是研究地表水动态的基础资源。
预处理阶段主要涉及数据格式转换、优化和标签标注。此阶段包括多个步骤:(1)收集全球地表水遥感数据产品并将其转换为矢量格式;(2)应用轮廓简化算法对特征进行平滑和简化;(3)选择代表性区域进行人工标注,为分类器提供训练和测试数据集。
在本研究中,我们使用JRC全球地表水制图图层v1.4范围作为主要数据集。该产品包含JRC在监测期内检测到的所有地表水体。它由504个栅格瓦片组成,每个瓦片覆盖10° × 10°的区域,共同覆盖南纬60°至北纬80°的范围。该产品包含单波段,其中像素值1代表水,0代表无水,255代表无数据。在排除没有水像素的瓦片后,剩下353个栅格文件。基于像素值和Douglas-Peucker算法,我们能够高效地对水体进行矢量化并简化顶点。
根据相关文献,我们选择了七个代表性区域:亚马逊河洪泛区、湄公河三角洲、青藏高原部分区域、北极圈部分区域、东非大裂湖泊区、澳大利亚部分区域和北美五大湖区。在这些区域内,对地表水矢量特征进行了人工分类和标注。
3.2. 碎片化水体的聚合
矢量化过程中产生的碎片化特征主要可分为三种类型:断开的狭窄河流碎片、宽阔河流和湖泊边缘碎片以及孤立碎片。
为了解决这三种类型的碎片化,我们采用了一种三阶段方法来识别和聚合碎片化水体。这是一种渐进的、多层的特征整合策略,从基于先验知识的强约束过渡到基于空间邻域关系的弱约束。该方法包括三个阶段:“河网约束—分类缓冲区—拓扑邻域”,旨在系统性地恢复全球水景的空间完整性,同时最大限度地减少误聚合错误。
在第一阶段,我们使用GRNWRZ V2.0全球河网数据集来恢复因狭窄河流碎片而中断的水文连通性。GRNWRZ V2.0提供了一个基于流域特征的七级分类系统。通过对比实验和分析,我们发现L5级河网数据取得了平衡:它确保了研究区域内所有主要河流的覆盖,同时有效区分了相互连接的湖泊和独立河流。
在河网周围构建了一个150米的缓冲区,所有在此缓冲区内的水体特征被标记为河流。与缓冲区相交的碎片化水体被假定源自相应的河流,并且同一缓冲区内的碎片被认为具有水文关联。此步骤背后的主要原理是,狭窄的河流碎片通常源于河流本身,可能是由于季节性水位波动或遥感提取过程中引入的误差。此阶段对于解决沿狭窄河道的线性碎片化和重建原始河流特征的连续性特别有效。
在第二阶段,为了解决宽阔河流和湖泊边缘碎片,我们应用了分类缓冲区方法。在此阶段,为第一阶段中标记为河流的水体特征创建了180米的缓冲区,而为未标记的水体特征创建了120米的缓冲区。缓冲区相交的碎片被聚合到同一特征中。其基本原理是,两个或多个空间上接近的水体碎片极有可能源自同一连续水系。类似地,较大河流或湖泊边缘的极小碎片极有可能属于同一水体,这主要是由于遥感观测误差。此阶段有效减少了独立水体数据中的碎片化。
在第三阶段,针对孤立碎片,我们采用了基于GIS的最近邻分析。在此阶段,对前两个阶段后未被标记为河流的水体特征,使用邻域关系和距离阈值进行分析。目的是增强全球连通性并提高非常小型水体的分类价值。现实中,小型水体常被桥梁、步道、沟渠分隔,或因云、阴影、雪/冰或噪声在遥感图像中显得碎片化。此阶段旨在处理相对孤立的水体特征的碎片化。设置了一个150米的距离阈值,并使用欧氏距离进行最近邻搜索。主要原理是,地理上相邻的水体碎片在自然形成过程中通常是同源的。在分类之前聚合附近的小碎片可以提高实际相关性并确保更强的逻辑一致性。
值得注意的是,为了确保几何操作过程中的度量精度,我们通过基于瓦片中心点的动态投影到相应的UTM带来减轻源WGS 1984地理坐标系(EPSG:4326)固有的投影变形。处理完成后,所有矢量特征被重新投影回WGS 1984。
这三个步骤可以显著减少碎片化水体的数量。水文先验和空间推理的结合使该方法能够在不同的气候和地形条件下可靠应用。通过此过程产生的聚合水体数据集为后续的河流和湖泊分类奠定了坚实基础。此外,尽管这种全球尺度的碎片缓解策略不能保证完全准确的聚合结果,但聚合操作并不会显著改变独立水体碎片的形状因子。换言之,它们不影响后续的分类结果,这使得这是一种高度可靠的聚合方法。
3.3. 水体的子类型分类
地表水体子类型通常包括河流、湖泊、湿地、运河等。在本研究中,仅考虑河流和湖泊。地表水体根据形态特征、水文动力学和湖沼学特性被分为这两个主要子类型。湖泊被定义为相对静止的自然或人工水体,被陆地包围,通常由降水、地下水或流入的河流补给。湖水通过蒸发或流出的河流排出,其表面积范围可从0.03平方公里到数万平方公里。河流则相反,是连续且具有方向性的,从高处流向低处,最终注入海洋、湖泊或其他水体。河流通常呈细长且蜿蜒的形状。其他水体子类型和未来研究的潜在方向在第5节详细讨论。此外,本研究最终的分类结果包含一个“其他”类别,它不对应于实际的地表水。该类别主要代表JRC GSW数据集中沿陆地海岸线建立的缓冲区。
为了实现地表水体子类型的细粒度分类,我们采用了混合CNN-Transformer架构分类