《Remote Sensing Applications: Society and Environment》:Cost-effective statewide wetland inventory update using weakly supervised deep learning: A case study in Minnesota, USA
编辑推荐:
本文提出一种基于弱监督学习的深度学习模型(U-Net++和DeepLabV3+)用于大规模湿地监测,通过变化检测和SNIC算法自动生成标注数据,在明尼苏达州实验中平均F1分数达91.3%,优于随机森林模型,有效提升湿地保护和碳核算效率。
维克托·伊格韦(Victor Igwe)| 巴赫拉姆·萨利希(Bahram Salehi)| 穆罕默德·马尔贾尼(Mohammad Marjani)| 尼玛·法拉哈迪(Nima Farhadi)| 马苏德·马迪安帕里(Masoud Mahdianpari)
美国纽约州立大学环境科学与林业学院(ESF)环境资源工程系,锡拉丘兹,NY 13210
摘要
湿地提供了重要的生态系统服务,包括水质净化、洪水调节、碳储存以及为多种物种提供栖息地。尽管湿地具有重要意义,但由于开发、农业和气候变化的影响,北美地区的湿地仍在持续减少。这种持续的减少威胁到了生态系统的完整性,并降低了湿地提供基本服务的能力。因此,定期更新和监测对于保护这些重要生态系统至关重要,以支持基于证据的管理并满足不断发展的保护政策的需求。一种经济有效的湿地监测方法是利用卫星图像进行分割。自动化遥感图像的分割可以加快地图制作的频率,从而实现更及时和高效的监测。卷积神经网络(CNN)等深度学习模型在分割任务中表现良好。然而,由于需要大量标注丰富的数据集,这些模型的应用在遥感领域仍然受到限制。由于标注数量庞大、标注过程复杂以及野外数据收集工作所需的时间和资金成本较高,定期更新地图面临重大挑战。因此,本文通过使用从现有专题产品中提取的弱标签来训练深度CNN,以实现明尼苏达州范围内的湿地监测。我们的方法首先通过变化检测从现有土地覆盖图中获取训练样本,识别出稳定的像素,然后利用简单非迭代聚类(SNIC)算法生成的物体来细化标签。利用这些弱标注样本训练并评估U-Net++和DeepLabV3+架构。在研究区域内,所提出的方法表现出了稳健的性能,U-Net++在七个分析类别中的平均F1分数为91.3%,而DeepLabV3+为90.6%,随机森林(RF)为88.3%。值得注意的是,U-Net++的表现优于其他模型,表明密集的跳跃连接能有效分类复杂的遥感场景(如湿地)。这些结果证明了所提出的基于弱标签的深度学习工作流程在明尼苏达州大规模湿地清查中的有效性,并且该方法也适用于其他土地覆盖分类问题。此外,更精确的地图有助于提高碳核算的准确性,并帮助确定优先恢复区域。这种可扩展的工作流程能够提供及时且经济高效的更新,对于制定明智的管理决策至关重要。
部分摘录
引言
湿地位于陆地与淡水或咸水系统交汇处,其特征是土壤持续饱和且周期性被淹没(Mahdianpari等人,2018年)。这些以灌木、挺水植物和森林为主的生态系统对于维持重要的生物地球化学循环和水文平衡至关重要(Marjani等人,2024年)。湿地具有多种关键功能,包括调节洪水、防止土壤侵蚀、过滤营养物质、捕获碳等。
研究区域
研究区域为明尼苏达州,面积约为225,000平方公里。明尼苏达州拥有多种类型的湿地,包括泥炭沼泽、沼泽和湿地(Steve等人,2019年)。在本研究中,这些湿地类型被分为三个主要的Cowardin系统(Cowardin等人,1979年):挺水湿地(草本)、森林湿地(木质)以及灌木-开阔水域湿地,如图1所示。在整个州范围内,挺水湿地占总面积的约6.3%。
提出的方法
在本节中,我们描述了如何使用LandTrendr和SNIC从现有湿地图中准备弱标注样本数据库,并使用提取的标签训练CNN模型的过程。图2总结了所提出方法的过程流程。
结果
图6展示了模型在30个训练周期内的训练集和验证集上的性能指标,突出了训练过程中的学习进展和验证准确性的变化趋势。总体而言,随着训练周期的增加,训练性能稳步提升。模型的验证准确率在87%到93%之间波动。我们注意到,在早期训练周期(尤其是第5个周期)中,大多数模型的验证准确性出现了急剧下降,这表明发生了过拟合现象。
讨论
本研究提出了一种从现有专题地图生成弱样本以训练深度CNN的方法。这些样本用于训练U-Net++和DeepLabV3+等深度CNN模型,并且其性能优于基线随机森林(RF)模型。该方法使用了LandTrendr变化检测算法来量化SWF和NDVI湿地指标的变化幅度(Igwe等人,2023年)。变化幅度图通过简单的阈值进行二值化处理。