基于冻结特征增强迁移学习的少样本长尾声呐图像分类方法研究

【字体: 时间:2025年06月16日 来源:Neurocomputing 5.5

编辑推荐:

  为解决声呐图像分类中样本稀缺(Few-shot)和长尾分布(Long-tailed)的挑战,东北大学团队提出FATL框架,通过冻结特征提取器与分类器的解耦训练、对比学习特征增强模块和平衡采样策略,在KLSG等数据集上实现SOTA性能,为水下目标识别(UATR)提供了新范式。

  

水下世界的神秘面纱长期依赖声呐技术揭开,但声呐图像分类面临两大"先天不足":数据获取成本高昂导致样本稀缺(Few-shot),以及目标类别天然不均衡形成的长尾分布(Long-tailed)。传统深度学习方法在ImageNet等光学数据集上大放异彩,却难以应对声呐图像这种"数据荒漠"场景。更棘手的是,现有方法往往在特征表达和类别平衡上顾此失彼——要么因样本不足导致特征多样性匮乏,要么被头部类别"带偏"而忽视尾部目标。这种困境严重制约了自主水下航行器(AUV)的环境感知能力,成为水下考古、资源勘探等应用的"卡脖子"难题。

东北大学机器人科学与工程学院的研究团队在《Neurocomputing》发表的研究中,创新性地提出冻结特征增强迁移学习(Frozen-feature Augmentation Transfer Learning, FATL)框架。该研究采用三阶段递进策略:首先冻结预训练特征提取器进行微调,保留通用特征表示;随后通过数值-通道双维度特征增强模块(融入对比学习)扩充特征空间;最后采用平衡子集采样策略训练分类器。实验选取KLSG、FLSMDD和NKSID三个典型声呐数据集验证,这些数据集具有明显的长尾特性(某些类别样本量不足5%)。

方法论
研究团队设计的分阶段训练架构独具匠心:1)特征提取器采用ResNet50
为基础网络,通过冻结参数避免小样本过拟合;2)特征增强模块在HSV颜色空间和通道注意力机制双重引导下生成扰动特征;3)分类器训练时将原始数据集划分为多个类别平衡的子集,采用交叉熵损失与三元组损失(Triplet Loss)联合优化。特别值得注意的是,对比学习中的正负样本对构建采用跨数据集策略,有效缓解了单一数据集样本不足的问题。

实验结果
在5-way 1-shot的极端设定下,FATL在KLSG数据集上达到72.3%的准确率,较基线方法提升9.8%。可视化分析显示,经过特征增强后的嵌入空间呈现出更清晰的类别边界,特别是尾部类别的特征聚集度提高23%。消融实验证实:单独使用特征增强或平衡采样仅能带来4.2%和5.1%的提升,而二者协同工作时产生12.7%的增益效应,验证了模块设计的协同性。

结论与展望
该研究突破性地将"冻结训练"理念引入声呐图像领域,通过特征空间"扩容"和样本空间"再平衡"的双轮驱动,为解决小样本长尾问题提供了新思路。技术层面上,特征增强模块的通道维度扰动(Channel-wise Perturbation)策略尤其值得关注,它使有限样本的特征多样性提升37%。实际应用中,该框架已部署于"潜龙"系列AUV的实时目标识别系统,在南海考古调查中实现沉船目标的少样本快速适配。未来研究方向包括:探索多模态数据(侧扫与前视声呐融合)的特征增强,以及开发动态可调的类别平衡策略以适应开放世界的长尾分布。

(注:全文数据与结论均源自原文,Zhongyu Bai等作者未报告任何利益冲突,研究受国家自然科学基金62203099等项目资助)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号