比较卷积神经网络和随机森林在阿波罗海洋公园底栖生境制图中的应用

《Remote Sensing in Ecology and Conservation》:Comparing convolutional neural network and random forest for benthic habitat mapping in Apollo Marine Park

【字体: 时间:2025年11月17日 来源:Remote Sensing in Ecology and Conservation 4.3

编辑推荐:

  海洋栖息地分类中CNN与随机森林模型的性能比较。研究在澳大利亚Apollo Marine Park使用多波束 bathymetry和backscatter数据,比较CNN与RF在三类栖息地(高能岩礁、低复杂度岩礁、沙贝壳混合)的分类效果。CNN整体准确率67.32%,优于RF的62.57%,尤其在过渡带分类中展现空间模式捕捉优势。两者均依赖 bathymetry和backscatter,但CNN自动提取多尺度空间特征,减少人工特征工程的主观性。研究提出CNN在复杂栖息地分类中的潜力,同时指出数据分辨率和预测变量选择对模型性能的影响。

  在海洋生态保护和资源管理的背景下,精准识别海底生境成为一项关键任务。海底生境地图不仅为决策者提供了重要的参考信息,还帮助确定需要特别保护的关键区域。随着技术的进步,深度学习算法,尤其是卷积神经网络(CNN),正逐渐成为提高海底生境分类精度的重要工具。本研究以澳大利亚维多利亚州的Apollo Marine Park(AMP)为案例,比较了CNN和随机森林(RF)模型在分类三种海底生境类型上的表现,探索了这两种方法在海洋空间规划中的应用潜力。

AMP是一个重要的海洋保护区,位于维多利亚州的东南部,自2007年设立以来,其生态价值逐渐显现。研究区域内的海底地形复杂,包含多样化的生境类型,如高能海底岩礁覆盖海绵、低复杂度海底岩礁与非密集生长的直立海绵,以及浅水沙和贝壳混合区。这些生境类型不仅支持丰富的生物多样性,还在生态系统服务方面发挥着重要作用,如作为幼鱼的栖息地、捕食者的觅食场所、碳封存和水体过滤等。因此,对这些生境进行准确的分类和制图对于制定有效的保护策略至关重要。

研究中使用的数据包括多波束测深数据、回波强度数据、波浪高度数据以及空间坐标。多波束测深技术能够提供高分辨率的海底地形信息,而回波强度数据则反映了海底底质的组成特征,有助于区分软沉积物与硬结构。波浪高度数据提供了关于海洋动力环境的重要信息,而空间坐标则帮助模型理解生境在海床上的分布模式。为了进一步增强分类能力,研究还计算了100种海底地形属性,如坡度、曲率、地形位置和粗糙度,这些变量捕捉了不同空间尺度下的地形特征。

然而,分类过程面临诸多挑战。特别是对于过渡性生境区域,其边界模糊,导致分类困难。这些区域的声学特性相似,使得不同生境之间的区分变得复杂。传统的分类方法依赖于人工提取的地形变量,虽然这些变量能够反映局部变化,但其应用受到预定义尺度的限制,难以充分捕捉复杂的过渡性生境。相比之下,CNN具有自动分析多尺度空间模式的能力,能够在像素层面识别更广泛的纹理和结构关系,从而提高分类的准确性。

在实验设计中,研究团队使用了两种模型进行对比分析。一种是传统的RF模型,它利用了100个地形衍生变量中的10个作为预测因子。另一种是基于原始多波束数据的CNN模型,通过滑动窗口的方式对每个像素进行分类,确保分类结果能够反映其周围环境的信息。实验结果显示,CNN的整体分类准确率为67.32%,而RF模型为62.57%。尽管CNN在整体表现上优于RF,但在某些特定生境类型上,其表现仍有提升空间。

在个体生境分类方面,CNN在“高能海底岩礁覆盖海绵”上的F1分数为0.664,而在“低复杂度海底岩礁与非密集生长的直立海绵”上的F1分数为0.538,而在“浅水沙和贝壳混合区”上的F1分数达到0.774。对应的RF模型F1分数分别为0.598、0.506和0.739。这些结果表明,CNN在处理某些具有复杂结构和纹理特征的生境时,表现出更强的分类能力。然而,对于过渡性区域,CNN和RF模型都面临挑战,尤其是在如何区分相邻生境类型方面。

研究还探讨了变量重要性分析,以了解哪些环境变量对分类结果影响最大。结果表明,Easting(东向坐标)和Bathymetry(测深数据)在两种模型中都具有较高的重要性。Easting在CNN中的影响表现为分类准确率下降了16%,而在RF中其重要性评分高达83.77。这说明Easting作为空间代理变量,能够反映深度和海底地形的梯度变化,对分类具有重要贡献。Bathymetry同样显示出较高的重要性,尤其在区分不同生境类型时,其对分类的指导作用显著。此外,Backscatter(回波强度)和Wave Height(波浪高度)也被证明是重要的预测因子,尽管RF模型中波浪高度的重要性评分略高于CNN模型。这一差异可能与数据归一化处理有关,因为在原始数据中,波浪高度的变化幅度较小,导致其在分类中的实际贡献有限。

在实际应用中,CNN的优势在于其对空间模式的自动提取能力。通过分析多个相邻像素的特征,CNN能够识别更复杂的生态结构,减少像素级分类中常见的“盐粒效应”(salt-and-pepper effect)。这种效应通常出现在RF模型中,因为其分类依赖于单个像素的特征,而无法充分考虑周围环境的影响。相比之下,CNN的滑动窗口机制使得相邻像素之间的分类更加连贯,从而提升了整体地图的清晰度和一致性。这表明,在具有复杂结构和过渡区域的海底环境中,CNN的分类能力具有显著优势。

然而,研究也指出,CNN的性能仍然受到数据质量和分类尺度的限制。由于研究中使用的多波束数据分辨率为3米,某些细小的生境特征可能无法被准确捕捉,从而影响分类精度。此外,分类方案的设定也对结果产生重要影响。例如,研究中采用的Combined Biotope Classification Scheme(CBiCS)虽然在结构上较为系统,但在某些特定研究区域可能并不完全符合生态和声学上的最佳划分方式。因此,未来研究可以考虑引入更灵活的分类框架,或者根据具体研究区域的生态特征对现有分类体系进行调整,以提高分类的准确性和适用性。

同时,研究团队还探讨了CNN和RF模型在不确定性估计方面的表现。虽然RF模型的不确定性估计较为可靠,能够反映分类的置信度,但CNN模型的不确定性评估存在一定的校准问题。这是因为CNN的softmax概率输出通常缺乏明确的不确定性度量,导致其结果在某些情况下不够稳定。尽管如此,CNN在分类结果的连贯性和一致性方面仍表现出色,这使得其在需要高精度和清晰边界划分的应用场景中更具优势。

此外,研究还提出了未来改进的方向。例如,引入更多环境变量,如海底流速和水体动态数据,可能有助于提高分类的准确性。同时,采用更先进的影像处理技术,如多频段回波强度分析、角度响应分析(ARA)或超角度立方体方法,可以进一步增强生境特征的区分能力。此外,探索更复杂的网络架构,如U-Net或基于对象的分割方法,可能有助于更精确地识别生境边界,提高分类的整体质量。

总的来说,本研究为CNN在海洋生境分类中的应用提供了重要依据。尽管CNN在某些方面表现优于传统方法,但其实际效果仍然受到数据质量和分类方案的限制。因此,未来的研究需要结合更精细的数据采集技术和更灵活的分类框架,以充分发挥CNN在海洋生态研究中的潜力。通过不断优化模型和数据输入,CNN有望成为提升海洋空间规划和生态保护效率的重要工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号