基于动态尺度感知标签分配与上下文增强的小目标检测方法(DCNet)及其性能提升研究

【字体: 时间:2025年09月22日 来源:Pattern Recognition 7.6

编辑推荐:

  本文提出DCNet模型,通过动态尺度感知(DSA)标签分配策略优化区域提议网络(RPN)中的正样本分配,并设计上下文增强模块(CEM)聚合多尺度特征以强化小目标(<16×16像素)的弱响应特征,显著提升微小目标检测性能。

  

Section snippets

Object Detection

现有基于深度学习的物体检测方法可分为两大主流:基于锚点的检测器(anchor-based detectors)与无锚点检测器(anchor-free detectors)。

基于锚点的检测器为给定图像定义一组锚点,并利用预设锚点内的内容进行分类和定位任务。此类检测器可进一步分为单阶段检测器(one-stage detectors)和两阶段检测器(two-stage detectors)。两阶段检测器采用由粗到精的策略,首先获取候选区域,再对候选区域进行细化分类与回归。

Proposed Method

图3展示了我们提出的DCNet整体架构。DCNet遵循Faster R-CNN检测范式,并采用动态尺度感知(Dynamic Scale-Awareness, DSA)标签分配和上下文增强模块(Contextual Enhancement Module, CEM)以提升小目标检测性能。

Datasets

AI-TODv1/v2[36]:该数据集专为小目标检测设计,包含700,621个标注目标和28,036张图像。其目标平均尺度仅为12.8像素,超过85%的目标面积小于16×16像素。数据集涵盖九类目标:飞机(AI)、桥梁(BR)、储罐(ST)、船舶(SH)、游泳池(SP)、车辆(VE)、人物(PE)和风车(WM)。

Implementation Details

DCNet采用ImageNet预训练的ResNet-50搭配FPN作为主干网络。训练阶段使用随机梯度下降(SGD)优化器进行12轮训练,权重衰减和动量分别设为0.0005和0.9。学习率初始值为0.005,在第8和第11轮时衰减0.1。批量大小在单张NVIDIA GTX 4090 GPU上设置为2。为保持训练初期模型稳定性,……

Conclusion

本文提出DCNet以提升小目标检测性能。具体而言,DCNet采用精心设计的DSA标签分配策略替代RPN中基于IoU的原始分配方式,为小目标提供更多正样本。此外,我们提出CEM模块,利用多尺度上下文信息增强小目标的特征响应。在多数据集上的大量实验证明了DCNet在小目标检测中的有效性。

Uncited float

表11。

CRediT authorship contribution statement

Tianyang Zhang: 撰写-审阅编辑、原稿撰写、方法论;Xiangrong Zhang: 审阅编辑、监督、资金获取、概念化;Chaozhuo Hua: 原稿撰写、软件、调研、数据整理;Guanchun Wang: 审阅编辑、可视化、验证、形式分析;Xiao Han: 可视化、验证、软件;Licheng Jiao: 审阅编辑、监督。

Declaration of competing interest

作者声明不存在已知的竞争性财务利益或个人关系影响本研究。

Acknowledgments

本研究受国家自然科学基金(项目号:62276197、62171332)、陕西省重点研发计划(2019ZDLGY03-08)、中国博士后科学基金(GZC20241321)及中国博士后科学基金(证书号:2024M762549)支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号