编辑推荐:
在水下声学目标分类中,传统方法和现有深度学习方法存在诸多局限,如依赖特征工程、信息损失等。研究人员开展基于频率分离策略的端到端水下声学目标分类研究,提出 FSNet。实验表明其精度高、计算效率高,为水下声学目标分类提供新方案。
在广袤的海洋世界里,水下声学目标分类对于海洋研究意义重大。无论是海上交通管理,还是水下环境监测,都离不开精准的水下声学目标分类技术。船舶在航行过程中会产生辐射噪声,这些噪声蕴含着船舶的重要信息,然而,海洋环境复杂多变,辐射噪声产生机制多样,再加上水下声学数据库有限,使得水下声学目标分类成为一项极具挑战的任务。
传统的水下声学目标分类方法,主要依赖特征提取将原始波形转换为二维紧凑表示,也就是 spectrogram(频谱图)。但这种方法需要大量先验知识,在实际应用中获取困难,而且低维的手工制作频谱图难以表征大规模数据集,导致传统方法在复杂动态的水下环境中泛化性能不佳。近年来,深度学习方法在水下声学目标分类任务中取得了不错的成果,多数方法以频谱图作为网络输入,虽然取得了较高精度,但仍存在手动调整特征参数困难、会丢失时域信号中复杂时间细节等问题。而基于波形的方法虽能直接从原始时域波形学习特征,却面临时间维度过多、下采样导致信息丢失以及缺乏显式频率特征提取机制等挑战。
为了解决这些难题,研究人员开展了端到端水下声学目标分类的研究,并提出了频率分离网络(FSNet)。这项研究成果发表在《Applied Ocean Research》上。
研究人员采用了多种关键技术方法。首先,设计了浅特征提取器(SFE)模块,用于从原始波形中提取低级特征。其次,提出了尺度自适应最大池化(SAMP)模块,该模块能自适应调整感受野大小,有效解决了传统下采样导致的信息丢失问题。同时,引入频率分离(FS)模块,通过显式构建低通和高通滤波器,分离不同频率分量,增强网络对不同频率信息的捕捉能力。此外,还使用了挤压激励(SE)模块,动态学习每个特征通道的重要性,进一步优化特征。最后,构建了频率分离块(FSBlock),由 FS 和 SE 模块的残差连接以及其他组件组成,进一步提取不同频率分量。
研究结果如下:
- 准确性表现:在两种常用的水下船舶辐射噪声数据集 ShipsEar 和 DeepShip 上进行实验,采用两种数据集划分方法 Task1 和 Task2。在 Task1 中,FSNet 在 ShipsEar 数据集上达到 99.64% 的准确率,在 DeepShip 数据集上达到 99.62%,均超越其他对比方法。在 Task2 中,FSNet 在 ShipsEar 数据集上准确率为 82.91%,在 DeepShip 数据集上为 78.39%,同样表现出色。通过 t-SNE 可视化和混淆矩阵分析发现,FSNet 能学习到更具判别力的特征,分类性能显著优于其他方法。
- 消融研究:研究发现,随着 FSBlocks 数量增加,网络性能逐渐提升,但考虑到性能和参数数量平衡,最终选择三个 FSBlocks。去除 FS 和 SAMP 模块会导致分类性能下降,验证了这两个模块的有效性。SAMP 模块自适应调整池化大小的性能优于传统最大池化。此外,随着训练数据增加,FSNet 模型精度逐步提高,即使训练集仅为 20% 时,其性能仍优于其他对比方法。
研究结论和讨论部分指出,FSNet 在水下声学目标分类任务中表现优异,在 ShipsEar 和 DeepShip 数据集上取得了较高准确率,且模型仅含 0.49M 参数,实现了分类性能和计算效率的良好平衡。SAMP 模块和 FS 模块在保留时间细节和区分频率分量方面发挥了关键作用。然而,FSNet 也存在一定局限性,如在更复杂水下环境中的泛化能力有待进一步评估,在极端嘈杂或信号退化环境下的性能可能下降。未来研究可考虑整合抗噪声特征或自适应滤波技术,提升其在复杂环境中的鲁棒性。总体而言,FSNet 为水下声学目标分类提供了一种高效且具有潜力的解决方案,对推动海洋监测等相关领域发展具有重要意义。