基于特征的聚类选择框架,用于不平衡声学数据上的二元分类

《Fisheries Research》:Feature-based cluster selection framework for binary classification on imbalanced acoustic data

【字体: 时间:2025年11月23日 来源:Fisheries Research 2.3

编辑推荐:

  本研究提出一种结合自监督学习(SSL)和聚类算法的水下声学目标分类方法,用于高效区分沙烯鱼与背景。通过提取SSL特征并迭代选择最优聚类,解决了传统方法依赖人工标注和计算效率低的问题。实验表明,SSL特征驱动的聚类方法在F1分数上接近完全监督的U-Net模型,同时显著减少背景噪声干扰,适用于标注稀缺的场景。

  在现代的海洋科学研究中,水下声学数据的分析扮演着至关重要的角色。水下声学不仅为渔业资源管理提供了基础支持,还能够帮助科学家理解海洋生态系统的复杂性。传统的水下声学目标分类(ATC)方法依赖于人工标注,这种手动标注过程不仅耗时,还容易因主观判断导致不一致。随着人工智能技术的发展,特别是机器学习和深度学习的应用,ATC方法正在经历变革。然而,大多数自动化的ATC方法仍然需要大量的精确标注数据,而获取这些标注数据在实践中面临诸多挑战。

本研究提出了一种结合自监督学习(SSL)和聚类分析的方法,用于对水下声学数据进行高分辨率分析。通过使用SSL技术提取特征,然后对这些特征进行聚类处理,该方法能够在不依赖精确标注的情况下,对像素级别的数据进行分类。此外,为了解决类别不平衡的问题,研究采用了一种过聚类策略,随后通过一种贪婪的聚类选择算法,利用已有的标注数据来最大化F1分数,从而提高分类的准确性和鲁棒性。最终,通过对每个像素的聚合概率进行计算并设定阈值,实现了分类标签的自动分配。

在方法上,研究使用了基于SSL的特征提取模型,该模型能够从声呐图像中学习到具有代表性的特征。这些特征被用来构建聚类,然后通过聚类选择算法优化分类结果。为了验证方法的有效性,研究还将其与直接使用原始数据进行聚类的方法进行了比较,并与一个完全监督的U-Net模型进行了对比。实验结果表明,基于特征的方法在精度和召回率上都优于直接使用原始数据的方法,并且其性能接近完全监督的U-Net模型。

研究的数据集来源于挪威的水下声学调查,涵盖了不同年份和频率的声呐图像。通过数据预处理,研究人员确保了数据的一致性和可比性。在数据处理过程中,所有的像素都被划分到重叠的8×8像素块中,每个块都被转换为向量,并进一步提取特征。通过这些特征,研究人员能够进行聚类分析,从而获得像素级别的分类结果。研究还采用了K-means算法进行聚类,并通过多次实验验证了该方法在不同聚类数量和初始中心设置下的鲁棒性。

实验结果显示,基于SSL特征的方法在识别沙丁鱼群方面表现优异。特别是在处理类别不平衡的数据时,这种方法能够更有效地分离出沙丁鱼和背景区域。相比之下,直接使用原始数据进行聚类的方法则表现较差,容易受到噪声和类别不平衡的影响。此外,研究还发现,基于SSL特征的方法能够更好地捕捉水下结构的特征,例如浮游生物层和海底,从而提高分类的准确性。

研究还比较了不同方法在训练集和测试集上的表现。基于SSL特征的方法在F1分数、精度和召回率上都优于直接使用原始数据的方法。尽管完全监督的U-Net模型在识别小规模沙丁鱼群方面表现更为出色,但基于SSL特征的方法在识别大规模沙丁鱼群方面具有优势,并且能够以较低的标注数据需求达到与U-Net模型相当的分类性能。这种方法特别适用于标注数据稀缺或不精确的情况,因为它能够在不依赖大量标注的情况下实现高质量的分类。

研究还探讨了基于SSL特征的聚类方法在不同应用场景中的潜力。该方法不仅适用于沙丁鱼的识别,还可以扩展到其他水下目标的分类任务中,例如浮游生物、珊瑚礁鱼类群落等。通过在像素级别上进行聚类和概率估计,这种方法能够提供高分辨率的分类结果,同时减少计算复杂度和数据噪声的影响。

总的来说,本研究通过结合SSL和聚类分析,为水下声学数据的自动分类提供了一种新方法。该方法在处理类别不平衡数据时表现出良好的性能,并且能够以较少的标注数据达到较高的分类精度。尽管完全监督的模型在某些细节识别任务上仍具有优势,但基于SSL特征的聚类方法为未来的水下声学研究提供了一种高效且可靠的替代方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号