一种用于声纳图像目标检测的增强型DETR网络

《IEEE Journal of Oceanic Engineering》:An Enhanced DETR Network for Sonar Image Object Detection

【字体: 时间:2025年11月25日 来源:IEEE Journal of Oceanic Engineering 5.3

编辑推荐:

  PAF-DETR基于Transformer架构提出实时高精度声呐图像检测方法,通过特征信息聚合模块和选择性注意力执行优化,有效解决弱目标、模糊轮廓及实时性挑战,在两个数据集上mAP@0.5分别提升2%和1.3%,推理速度达65FPS。

  

摘要:

本文提出了一种更精确、更快速的检测Transformer(PAF-DETR),这是一种基于Transformer架构的实时高精度声纳图像目标检测器。该方法充分考虑了实际水下检测任务中遇到的弱目标、模糊轮廓以及实时性要求所带来的挑战。通过比较不同架构的检测器,我们首先分析了实现实时部署所需的条件。为了增强特征表示能力,我们设计了一个特征信息聚合模块,并将其嵌入到检测框架的“颈部”(路径聚合网络)中,从而实现关键多尺度特征的有效融合。此外,为了降低解码器的计算成本,PAF-DETR引入了一种新颖的注意力机制,该机制能够选择性地过滤编码器产生的token,从而在保持检测准确性的同时提高计算效率。这些改进使得PAF-DETR具备了更优越的计算效率和实时性能。实验在两个定制的声纳数据集上进行,结果表明,所提出的PAF-DETR检测器在平均精度(mAP@0.5)方面分别达到了86.7%和95.4%,比基线算法RT-DETR-L高出2%和1.3%。另外,在两块RTX 3080 Ti GPU上进行评估时,PAF-DETR的推理速度约为每秒65帧,略高于对比检测器。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号