利用新标注的多源遥感数据和地理基础模型对积满碎屑的冰川进行测绘
《Science of Remote Sensing》:Debris covered glacier mapping using newly annotated multisource remote sensing data and geo-foundational model
【字体:
大
中
小
】
时间:2025年10月31日
来源:Science of Remote Sensing 5.2
编辑推荐:
本研究构建了首个全球冰川表面碎屑数据集(GSDD),包含1876张多光谱遥感图像,覆盖喜马拉雅、安第斯山脉等五个冰川区。通过对比Prithvi GFMs(结合UperNet解码器)与DeepLabv3+、U-Net等模型的性能,发现Prithvi在mIoU(0.80)和F1分数(0.91)上显著优于其他模型,尤其在冰川终端映射和区分表面碎屑与周边地形方面表现突出。优化波段组合(B-G-NIR-SWIR-Slope-Elevation)和UperNet解码器设计是该研究的关键创新,为全球冰川监测提供了可靠的技术框架。
### 解读:利用深度学习技术对覆盖冰川碎片的自动映射研究
冰川是全球气候变化的敏感指标,其对气候变化的反应涉及冰川质量变化、流动速度变化、新冰川湖的形成以及冰川前缘湖泊的扩展等(Hugonnet et al., 2021;The GlaMBIE Team et al., 2025)。冰川不仅在气候监测中发挥着重要作用,还与地质灾害密切相关,并且是全球数亿人口赖以生存的淡水资源来源(Immerzeel et al., 2020)。这些淡水资源对于工业、家庭和农业需求至关重要,因此对冰川的可持续发展具有重要影响。然而,近年来的研究和预测表明,这些淡水资源在全球范围内正经历前所未有的枯竭(Mountain Research Initiative EDW Working Group, 2015)。此外,最新的研究指出,由于冰川的特征差异,如冰川的大小和覆盖的碎片情况,冰川对气候变化的反应呈现出异质性(Hugonnet et al., 2021;Maurer et al., 2019;Rounce et al., 2023;The GlaMBIE Team et al., 2025)。
覆盖冰川的碎片(即在冰川表面的碎屑)在冰川对气候变化的响应中起着关键作用。薄层的碎片可能通过吸收更多的太阳辐射来增强冰川融化过程,而厚层的碎片则可能作为隔热层来减少融化速度(Anderson and Anderson, 2018;Herreid and Pellicciotti, 2020;?strem, 1959)。然而,由于冰川表面的碎片与冰川外围的碎片在光谱特性上存在相似性,自动映射覆盖冰川的碎片仍然面临重大挑战。为了克服这一障碍,研究人员引入了深度学习技术,但受限于高质量公开数据集的缺乏以及对最优模型架构的探索不足,该领域的进展受到了一定限制。为此,本文提出了一种新的全球覆盖冰川碎片数据集(Global Supraglacial Debris Dataset, GSDD),该数据集包含了来自不同冰川区域的1,876张图像,总面积约为49,000平方公里,涵盖高山区、安第斯山脉、西加拿大、阿拉斯加和瑞士阿尔卑斯山等地区,以体现冰川特征和环境的多样性。
GSDD数据集包括10个光谱波段,如蓝、绿、红、近红外、短波红外(SWIR1和SWIR2)、归一化岩石指数(NDRI)、坡度、高程和速度,这些数据提供了关键信息以区分冰川碎片。为了评估深度学习模型在映射冰川碎片方面的有效性,我们比较了多种模型,包括Prithvi Geo-Foundational Model(GFM)结合多个解码器、基于卷积神经网络(CNN)的模型(如UNet、Attention U-Net和DeepLabv3+)、基于视觉Transformer(ViT)的模型(如TransNorm)以及Prithvi GFM的变体(如UViT)。实验结果显示,Prithvi GFM结合UperNet解码器的表现最为出色,达到了mIoU=0.80和F1分数=0.91,超过了DeepLabv3+(mIoU=0.71)、Attention U-Net(F1=0.73)、UNet(F1=0.72)、TransNorm(F1=0.71)和UViT(F1=0.70)。这些结果表明,在准确映射冰川末端和识别冰川前缘方面,该方法具有显著的改进。
GSDD数据集的构建采用了系统化的Python流程,以最小化人工干预。首先,通过Amazon Web Services(AWS)获取了在冰川消融季节的Sentinel-2A数据,并使用小于25%的云覆盖过滤器确保数据一致性。随后,SWIR1和SWIR2波段通过双线性插值重新采样至10米的空间分辨率,以与蓝、绿、红和近红外波段对齐。接下来,计算了归一化岩石指数(NDRI),利用蓝波段和红波段之间的归一化差值来区分碎片和岩石与非碎片特征。随后,获取了Copernicus数字高程模型(DEM)数据,并将其重新投影和重新采样,以与Sentinel-2图像对齐,同时裁剪以匹配Sentinel-2的栅格范围,确保图像和DEM的一致性和对齐性。使用这些DEM数据,我们还计算了每个站点的坡度。此外,我们从NASA ITS Live数据集中获取了辅助速度数据,并以类似的方式进行了重新投影、重新采样和裁剪,以保持各层之间的对齐。最终,所有层被堆叠以创建包含十个波段的复合图像,即蓝、绿、红、近红外、短波红外(SWIR1和SWIR2)、NDRI、坡度(S)、高程(E)和速度(V)。
在标签生成方面,我们使用了由Herreid和Pellicciotti(2020)提供的全球覆盖冰川碎片数据集。由于该数据集主要基于2015年左右的Landsat图像,我们在测试数据集中对冰川末端区域的碎片边界进行了部分调整,使用Sentinel-2图像进行补充。随后,将这些边界通过图像数据进行栅格化,以标准化几何、范围、坐标参考系统和空间分辨率。最终的数据集包含两个类别:0(非覆盖冰川碎片)和1(覆盖冰川碎片)。图像和对应的标签被分割为非重叠的512×512像素的瓦片,并且只保留那些至少包含5%覆盖冰川碎片的瓦片。
在模型评估方面,我们主要关注了两个关键的评估指标:交并比(mIoU)和Dice相似度系数(DSC),后者也被称为F1分数。这两个指标广泛用于分割任务(Szwarcman et al., 2024)。F1分数代表了精确度和召回率的几何平均值,而mIoU是分割任务中的关键指标,反映了模型预测与真实值的重叠部分。在对覆盖冰川碎片的映射任务中,真阳性(TP)表示模型正确预测的覆盖冰川碎片像素,假阳性(FP)表示模型错误分类为覆盖冰川碎片的非碎片像素,假阴性(FN)表示模型错误分类为非碎片的覆盖冰川碎片像素。通过分析这些指标,我们可以评估模型在不同任务中的表现。
在实验设计方面,我们使用了NVIDIA RTX A6000 GPU进行所有实验。数据集被划分为80%用于训练,10%用于验证,10%用于测试。特别强调的是,测试数据集的选择尽量避免与训练和验证数据集的自相关性(如图1E和图1G所示)。在第二个实验中,我们进行了4折交叉验证,使用整个数据集进行训练和测试。在每个拆分中,75%的数据用于训练,25%用于测试。这种设计旨在减少偏差并展示结果在整个数据集中的一致性。为了尽可能地使实验具有可比性,我们设定了种子为42,使用了批量大小为2,采用了焦损失函数,AdamW优化器,以及学习率为1×10??。此外,我们使用了余弦学习率调度器并加入了预热和重启机制以实现模型收敛。
在模型的评估指标方面,我们重点关注了两个关键指标:交并比(mIoU)和Dice相似度系数(DSC),后者也被称为F1分数。这两个指标广泛用于分割任务(Szwarcman et al., 2024)。F1分数代表了精确度和召回率的几何平均值,而mIoU是分割任务中的关键指标,反映了模型预测与真实值的重叠部分。通过分析这些指标,我们可以评估模型在不同任务中的表现。
在结果部分,我们的实验结果显示,Prithvi GFM结合UperNet解码器在GSDD数据集上的表现优于先进的CNN模型和从头训练的视觉Transformer模型。Prithvi GFM达到了0.91的F1分数和0.80的mIoU,而UViT(也使用Prithvi编码器)的表现显著较差,mIoU仅为0.70。相比之下,先进的CNN模型如Attention U-Net、DeepLabv3+和UNet的mIoU分别为0.73、0.71和0.72。从头训练的视觉Transformer模型“TranNorm”也表现出了与先进CNN模型相当的性能,达到了0.71的mIoU。这一观察结果对于之前的研究和一般理解具有重要意义,因为这些研究曾指出视觉Transformer需要比CNN模型更多的训练数据才能表现出色,而我们的结果表明,使用相同的训练数据集,视觉Transformer也具有潜力。
此外,我们还分析了每个图像的mIoU分布,结果表明Prithvi GFM在所有其他深度学习模型中表现最为一致,其标准差仅为0.12(见表1和图5a)。这进一步验证了Prithvi GFM在不同区域和时间段中的稳定性。在第二个实验中,我们进行了4折交叉验证,Prithvi GFM的表现依然出色,达到了0.74的mIoU,超过了DeepLabv3+的0.69。其他模型,如TransNorm、UNet和Attention U-Net,的mIoU分别为0.66,而UViT的mIoU仅为0.62(见表2)。这一分析进一步支持了第一个实验的结果,强调了Prithvi GFM在各种条件下的优越性能。我们还检查了每折计算的mIoU分布,发现Prithvi GFM在每折中都优于其他模型(见图5b),这突显了其在不同区域和复杂条件下的泛化能力。
在定性评估方面,结果的视觉分析显示,大多数深度学习模型成功捕捉了覆盖冰川碎片的整体模式(见图8)。这些结果展示了深度学习模型和构建的GSDD数据集在区分覆盖冰川碎片像素和非覆盖冰川碎片像素方面的潜力。定性评估进一步突出了覆盖冰川碎片与冰川环境中其他常见特征(如外围碎片、冰和湖泊)之间的明显区别(见图8和图9)。详细的比较评估显示,UViT、UNet、Attention U-Net、DeepLabv3+和TransNorm等模型在某些情况下表现出更多的误分类,而Prithvi GFM则显示出与真实值最接近的匹配。例如,图8和图9展示了Prithvi GFM在冰川末端映射中的卓越表现,特别是其能够准确识别冰川前缘,这是人工解释中广泛认可的可靠视觉线索。这些发现不仅在冰川监测领域具有重要意义,也对更广泛的计算机视觉研究社区提供了启示,表明构建可靠、可适应的模型可以减少人工标注和计算资源的需求。
GSDD数据集的生成和应用在冰川碎片映射领域具有重要意义。该数据集由1,885张图像和相应的标签组成,覆盖约50,000平方公里的区域。数据集包括来自不同冰川化区域的训练和验证数据,如东喜马拉雅、中喜马拉雅、西喜马拉雅、喀喇昆仑山脉、欧洲阿尔卑斯山、西加拿大、安第斯山脉和阿拉斯加。为了独立测试,我们选择了西喜马拉雅和阿拉斯加的站点,以评估该方法和数据集的时空可迁移性。GSDD是一个前所未有的资源,它使研究人员能够直接实施和比较针对覆盖冰川碎片映射的方法,尤其是在缺乏专门针对深度学习应用的冰川碎片数据集的背景下。该数据集对计算机视觉、机器学习和地球观测研究社区具有重要价值,它为评估、比较和开发模型提供了一个独特的基准,特别是在处理冰川这一复杂地表特征方面。此外,该数据集支持测试和优化Geo-Foundational Model(GFM)在下游任务中的应用,为未来的冰川研究提供了坚实的基础。
在局限性和未来展望部分,我们的实验结果表明,尽管GSDD数据集和提出的模型在映射覆盖冰川碎片的范围方面表现出色,但仍存在一些限制。例如,模型在覆盖冰川碎片的侧边和小冰川的末端区域表现不佳。我们的分析表明,当覆盖冰川碎片的面积在0.5–1平方公里之间时,模型的准确性会降低,而中等和大型冰川则表现出更高的准确性。这种局限性可能有两个原因:首先,模型难以学习小碎片范围的空间模式,因为缺乏足够的区分特征;其次,训练数据集主要包含大于1平方公里的冰川,这限制了其对小型系统的泛化能力。为了优化模型输入,我们进行了18次实验,测试了各种波段组合。我们的发现表明,将光学波段(如B-G-NIR-SWIR)与坡度和高程或速度波段结合可以取得最佳效果。特别是波段组合B-G-NIR-SWIR-Slope-Velocity和B-G-R-SWIR-Slope-Elevation被证明是最有效的。这些见解对于扩展该方法至关重要,因为生成全球、时空覆盖冰川碎片数据集在计算上是昂贵的。对最佳波段组合的先验知识将有助于实现高效和准确的映射。
在方法论的进展方面,本文展示了Prithvi GFM与UperNet解码器结合后在覆盖冰川碎片映射中的卓越性能。我们比较了多种模型,包括基于CNN的模型(如DeepLabv3+、UNet和Attention U-Net)、基于视觉Transformer的模型(如TransNorm)以及使用Prithvi编码器的变体(如UViT)。定量和定性评估一致表明,Prithvi GFM优于其他模型。使用UperNet解码器,Prithvi GFM在覆盖冰川碎片映射任务中表现优异,达到了0.91的F1分数和0.80的mIoU,显著高于其他模型的性能。这些结果表明,Prithvi GFM在处理覆盖冰川碎片这一复杂任务方面具有显著优势。
在模型的解码器选择方面,我们测试了Prithvi GFM与不同解码器(如UperNet、FCN和Identity)的结合效果。实验结果表明,Prithvi GFM结合UperNet解码器的表现优于其他解码器。例如,使用FCN和Identity解码器的模型在mIoU方面分别达到了0.77,而使用UperNet解码器的模型则达到了0.80。这表明,在较为简单的任务中,FCN和Identity解码器可能是一个更好的选择,尤其是在计算资源有限的情况下。这些观察结果也为未来的研究提供了方向,鼓励开发新的解码器以进一步提升覆盖冰川碎片映射的准确性。
在数据集的应用方面,GSDD数据集的生成和使用对于地球观测、计算机视觉和机器学习社区具有重要意义。该数据集不仅为研究人员提供了一个独特的基准,用于评估、比较和开发模型,还支持测试和优化Geo-Foundational Model(GFM)在下游任务中的应用。通过这些数据集,研究人员可以更好地理解覆盖冰川碎片的分布模式,并改进对冰川的监测和预测能力。此外,该数据集的生成和应用有助于更新冰川库存,并改进冰川水文和海平面上升预测模型。
在未来的方向上,我们看到了在覆盖冰川碎片映射中开发通用或定制深度学习模型的广阔前景。我们认为,研究人员和地球科学家可以专注于三个主要领域来推动快速、准确和可扩展的冰川映射方法。首先,Geo-Foundational Models(GFMs)为改进覆盖冰川碎片映射和生成时空冰川库存提供了实用和可扩展的基础。在本研究中,我们评估了Prithvi GFM的两个变体:一个结合UperNet解码器并使用六个选定波段进行微调,另一个则使用Prithvi编码器与U-Net架构结合,通过Squeeze-and-Excitation(SE)层实现多传感器输入(UViT)。我们的结果清楚地表明,Prithvi GFM结合UperNet解码器的表现优于基于UViT的配置。这些发现为开发更先进的混合架构铺平了道路,这些架构可以利用全局注意力和任务特定的解码策略来提高性能。除了Prithvi,其他有前景的GFMs也在不断涌现,包括DOFA(Xiong et al., 2024),该模型基于多种多模态地理空间数据训练;Clay(https://madewithclay.org),目前最大的预训练GFM,训练数据涵盖了多种传感器和平台;以及Galileo(Tseng et al., 2025),一个最近的模型,已经在多种地球观测下游任务中展现出强大的泛化能力。此外,任何到任何的生成式GFM TerraMind(Jakubik et al., 2025)为在微调过程中整合人工生成数据集提供了独特的机会。这些能力可能为在数据有限的场景中,如受云层影响的区域,提升映射性能开辟新的途径。
在结论部分,本文提出了第一个全球覆盖冰川碎片数据集(GSDD),旨在评估深度学习模型在覆盖冰川碎片映射中的性能。该数据集涵盖了不同高程区域、气候条件、冰川形状、大小、外观和降水来源的广泛冰川碎片特征。我们使用了多种深度学习模型,包括基于CNN的模型(如DeepLabv3+、UNet和Attention U-Net)、基于视觉Transformer的模型(如TransNorm)以及Prithvi GFM的两个变体(UperNet解码器和UViT架构)。我们的结果表明,Prithvi GFM结合UperNet解码器在GSDD数据集上的表现最佳,达到了0.91的F1分数和0.75的mIoU,超过了DeepLabv3+(mIoU=0.61)等其他模型。定量和定性评估一致表明,Prithvi GFM在其他模型中具有显著优势。此外,Prithvi GFM需要的训练周期较少,这得益于其在HLS数据上的大规模预训练,这也有助于计算效率。
综上所述,本文通过构建GSDD数据集和采用Prithvi GFM结合UperNet解码器,为覆盖冰川碎片的自动映射提供了新的方法。这一方法在准确识别冰川前缘和减少人工干预方面具有显著优势。然而,模型在小冰川和冰川末端区域的表现仍有提升空间。因此,未来的研究可以集中在优化模型输入、改进解码器设计以及探索多模态数据融合策略,以进一步提高覆盖冰川碎片映射的准确性和泛化能力。此外,GSDD数据集的生成和应用为地球观测、计算机视觉和机器学习社区提供了宝贵的资源,有助于推动冰川研究的进展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号