一种结合注意力机制和加权特征融合的单阶段检测器,用于航空图像中小目标的检测
《Engineered Regeneration》:Attention-integrated one-stage detector with weighted feature fusion for small object detection in aerial images
【字体:
大
中
小
】
时间:2025年12月11日
来源:Engineered Regeneration CS22.5
编辑推荐:
小型物体检测在无人机图像中面临像素规模小、特征稀疏和背景复杂度高的问题。本文提出AWAGS-YOLO,在YOLO-11基础上引入注意力增强的骨干网络、双向特征金字塔融合、全局注意力模块和SIoU损失函数。实验表明,在VisDrone2019和自建Realm数据集上,其mAP50:95分别提升7.46%和8.24%,同时保持实时性。研究证实多尺度特征融合与注意力机制能有效提升小目标检测精度,为无人机应用提供新方案。
无人机航拍图像中存在大量尺寸微小、背景复杂的目标,传统YOLO系列模型难以有效识别。本文提出AWAGS-YOLO改进架构,通过多维度技术创新显著提升小目标检测能力。该研究针对现有模型的三大痛点展开突破:首先,小目标在图像中像素占比低,导致特征提取不足;其次,高分辨率航拍图像存在大量背景干扰信息;第三,传统单阶段检测器的特征融合机制对微小物体适应性差。通过融合注意力机制、多尺度特征融合和优化损失函数,新模型在标准数据集和自建Realma数据集上均取得突破性进展。
在模型架构方面,研究团队对YOLO-11进行系统性改造。骨干网络引入C3k2Attn模块,通过局部注意力机制增强特征提取能力,特别针对边缘细节和纹理特征进行强化。在特征融合层,采用双向特征金字塔网络(BiFPN)并创新性引入可学习的权重融合机制,能够根据不同尺度特征的重要性动态调整融合权重,解决传统拼接融合易丢失关键信息的缺陷。 neck部分集成CBAM(通道-空间注意力模块)和GAM(全局注意力模块),形成双重注意力增强体系:CBAM通过局部特征聚焦有效抑制背景噪声,GAM则整合全局上下文信息,这对识别被遮挡或环境复杂的小目标至关重要。
损失函数方面,摒弃传统IoU损失,采用SIoU(几何感知交并比)损失。该函数创新性地引入距离惩罚项、角度对齐项和形状相似性项,在保持检测精度的同时显著提升小目标定位精度。实验数据显示,相较于基准模型YOLO-11,AWAGS-YOLO在VisDrone2019数据集上mAP50:95指标提升7.46%,在自建 Realm数据集提升8.24%。这种提升源于多模块协同优化:注意力机制提升特征表达能力,动态融合策略增强多尺度特征利用,几何感知损失优化边界框回归。
性能验证部分采用双数据集对比验证。VisDrone2019作为标准评测集,包含10个典型类别,平均尺寸较小且分布密集。结果显示,AWAGS-YOLO在精确度(49.8% vs 43.2%)、召回率(31.6% vs 29.4%)和综合mAP指标均优于基准模型。特别值得注意的是,在IoU阈值从50%到95%的严格测试中,新模型保持稳定提升,验证了其泛化能力。自建Realm数据集包含12个类别,包含更多无人机实际场景中的复杂情况,如建筑群遮挡、光照变化等。测试表明,AWAGS-YOLO在精度(82% vs 79.8%)、召回率(71.1% vs 70.1%)和严格mAP(48.6% vs 44.9%)方面均有显著优势。
模型效率分析显示,改进后的AWAGS-YOLO在保持轻量化设计(参数量仅增加28%)的同时,推理速度仍达271FPS,满足实时检测需求。对比实验表明,其参数量(3.3M)和计算量(8.5G FLOPs)处于YOLO系列模型的优化区间,在精度提升与效率保持之间取得平衡。消融实验进一步验证各模块的有效性:单独启用注意力模块仅带来微弱提升,但结合BiFPN和SIoU后性能呈指数级增长,验证了多技术融合的协同效应。
实际应用层面,研究团队通过无人机航拍系统验证模型性能。搭载Raspberry Pi摄像头的Striver Mini无人机在复杂场景(如校园建筑群、交通枢纽)中,AWAGS-YOLO成功识别出传统模型漏检的12.3%小目标,包括隐藏在广告牌后的车辆、低空飞行的无人机等。特别在夜间弱光环境下,模型通过增强的局部注意力机制,仍能保持89%以上的检测准确率,这对安防监控和灾害应急响应具有重要价值。
该研究的创新性体现在三个方面:一是首次将双向特征金字塔与可学习权重融合结合,解决了传统FPN网络在跨尺度特征对齐上的不足;二是创造性地将全局注意力机制引入YOLO框架,使模型能够有效利用场景全局信息;三是提出的SIoU损失函数突破传统IoU局限,通过几何约束机制显著提升小目标定位精度。这些技术突破共同构建了新型检测范式,为无人机视觉系统的小目标检测提供了可靠解决方案。
未来研究方向包括:1)开发轻量化注意力模块以进一步降低计算量;2)探索跨域迁移学习,提升模型在新场景中的适应能力;3)研究动态调整学习率策略,应对不同复杂度场景。研究团队已启动后续工作,计划将注意力机制扩展至多模态数据融合,并尝试在边缘计算设备(如Jetson Nano)实现实时推理,这将为移动端无人机检测提供新思路。
本研究的理论价值在于验证了轻量化模型通过结构优化而非参数堆砌同样可实现性能突破。实验数据表明,AWAGS-YOLO在保持YOLO系列高效推理特性的同时,将小目标检测精度提升约15%,这在当前单阶段检测器中属于领先水平。其实践意义体现在多个应用场景:城市交通监控可实时追踪逆行电动车;农业巡检能精准识别作物病虫害;边境巡逻可自动识别非法越境无人机等。研究证明,通过针对性架构优化,无人机视觉系统的小目标检测能力可以得到实质性提升,为智能安防、精准农业等领域的自动化升级提供了关键技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号