
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于种群平衡编码分类的水下声学目标识别新方法:小样本场景下的高效模型构建
【字体: 大 中 小 】 时间:2025年06月17日 来源:Ocean Engineering 4.6
编辑推荐:
针对水下声学目标识别(UATR)中多类别样本不平衡和小样本训练的挑战,研究人员提出种群平衡编码分类器(PBCC)。该方法通过融合MFCC/GTCC稳态与瞬态特征、加权纠错输出码(WECOC)编码空间冗余设计,在两类公开数据集上实现优于传统统计方法(SVM/KNN)和深度学习模型(CNN/Transformer)的识别精度与速度,尤其在小样本场景展现显著优势,为海洋监测装备智能化提供新思路。
海洋中船舶的"声音指纹"如何被精准识别?这项研究给出创新答案
浩瀚海洋中,船舶辐射噪声(SRN)如同水下世界的"声音指纹",承载着船舶类型、推进系统等关键信息。水下声学目标识别(UATR)技术通过分析这些声学特征,在海洋资源勘探、生态保护等领域具有重要应用价值。然而,复杂多变的海洋环境给SRN识别带来两大核心难题:短时稳定而长时不稳定的声学特性,以及不同船舶类型样本量严重失衡的客观现实。传统统计方法如支持向量机(SVM)、K近邻(KNN)依赖单一特征导致识别率有限,而深度学习模型如卷积神经网络(CNN)、视觉Transformer虽性能优越,却需要海量训练数据支撑。如何在小样本条件下构建高精度识别系统,成为制约UATR技术实际应用的关键瓶颈。
中国某研究团队在《Ocean Engineering》发表的研究中,创新性提出种群平衡编码分类器(PBCC)。该方法通过多特征融合与自适应编码策略,在ShipsEar等公开数据集上实现89.7%的平均识别准确率,较传统方法提升12.3%,训练耗时仅为深度学习的1/8。关键技术路线包含:1)融合MFCC(梅尔频率倒谱系数)和GTCC(伽马通频率倒谱系数)及其一阶差分(Delta)、二阶差分(Delta-delta)系数,同步捕捉声学信号的稳态与瞬态特征;2)设计加权纠错输出码(WECOC)框架,通过样本权重编码缓解类别不平衡问题;3)引入编码空间自适应冗余机制增强纠错能力。
特征提取
研究团队发现SRN在200ms时间窗内具有稳定性,但长时记录会出现显著波动。为此,PBCC采用13维MFCC表征信号频谱包络,20维GTCC模拟人耳听觉特性,配合39维动态差分系数构成72维混合特征向量。实验显示该方案较单一特征提取使类间可分性提高37.6%。
WECOC编码机制
针对船舶类型样本量差异可达8:1的现实问题,PBCC创新性地将样本数量倒数作为编码权重,构建K×L维编码矩阵(K为类别数,L为编码长度)。通过汉明距离解码时,小类别样本获得更高投票权重,使五类不平衡数据集的召回率均衡性提升至0.91(F1-score)。
计算效率优化
PBCC采用基于矩阵运算的批处理模式,特征提取阶段通过预计算滤波器组降低60%运算量。在Intel i7平台测试中,处理1分钟音频仅需0.8秒,实时性显著优于需要GPU加速的Swin Biformer等深度学习模型。
研究结论表明,PBCC通过种群平衡编码策略有效解决了UATR领域长期存在的"小样本悖论"——即模型性能与数据需求量之间的矛盾。相比需要百万级样本训练的CAF-ViT等模型,PBCC在仅300个样本条件下即可达到相当识别精度。讨论部分特别指出,该方法在港口安防场景的实测中成功区分出柴油机渔船与电动游艇的细微声学差异(ΔMFCC4-7
0.3dB),验证了工程适用性。
这项研究为受限数据条件下的水下目标识别提供了新范式,其编码空间冗余设计思想可延伸至医疗影像分析等其他小样本分类场景。未来工作将探索声学特征与AIS(船舶自动识别系统)数据的多模态融合,进一步提升复杂海洋环境下的识别鲁棒性。
生物通微信公众号
知名企业招聘