
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自适应门控策略与动态多尺度聚焦模块的无人机影像小目标检测增强方法S-YOLO
【字体: 大 中 小 】 时间:2025年07月03日 来源:Neural Networks 6.0
编辑推荐:
【编辑推荐】针对无人机航拍图像中小目标检测存在的模糊、遮挡及背景干扰等问题,研究人员提出基于YOLOv10的S-YOLO框架,通过引入C2fGCU模块的动态特征调制和DMSF模块的多尺度融合优化,在VisDrone2019等数据集上实现mAP50:95最高提升5.3%,同时保持285 FPS的实时性能,为低空目标检测提供了高精度轻量化解决方案。
随着无人机技术在农业监测、军事侦察等领域的广泛应用,高空拍摄带来的小目标检测难题日益凸显。图像中目标尺寸微小、背景复杂、光照多变等问题导致传统算法出现大量漏检误检。尽管YOLO系列等单阶段检测器能实现实时处理,但面对160×160像素以下的微小目标时,其浅层特征提取不足、多尺度融合僵化等缺陷显著制约性能。现有改进方案如DETR的全局注意力机制易忽略局部细节,YOLOX缺乏动态特征筛选能力,而Gold-YOLO在复杂背景下对小目标响应较弱。
为解决上述问题,来自新疆维吾尔自治区重点实验室的研究团队在《Neural Networks》发表论文,提出S-YOLO新型检测框架。该研究通过三阶段创新:首先在特征金字塔中增设P2检测层并移除P5层,强化160×160尺度特征提取;其次设计C2fGCU模块,利用门控卷积单元(GCU)实现特征激活强度的自适应调节;最后开发动态多尺度融合(DMSF)模块,结合SE-Norm通道注意力优化跨尺度特征权重。实验采用VisDrone2019、AI-TOD和DOTA1.0数据集验证,样本涵盖12类典型低空目标。
关键技术方法
研究以YOLOv10n为基线,通过架构改造实现优化:1) 特征金字塔输出层调整为P2-P4;2) 在骨干网络前两个C2f模块前嵌入C2fGCU,通过双分支结构和门控机制抑制背景噪声;3) 在颈部网络引入DMSF模块,采用通道注意力动态融合多尺度特征;4) 检测头改用BCE-Dice联合损失函数提升分类精度。
Enhanced Small Object Detection Layers
通过增设P2层并移除P5层,模型对160×160分辨率特征的提取能力显著增强,在VisDrone2019测试集上使小目标召回率提升12.6%。
C2fGCU Module
门控卷积单元通过深度特征分析动态调节激活阈值,实验显示该模块使背景干扰区域的误报率降低23%,同时关键特征响应强度提升1.8倍。
Dynamic Multi-Scale Fusion Module
DMSF模块通过SE-Norm权重校准和多尺度特征交互,在AI-TOD数据集上实现跨尺度特征融合误差减少34%,mAP50:95提升4.4%。
研究结论与意义
S-YOLO在保持参数量比YOLOv10n减少7%的前提下,三大数据集检测精度全面提升,最高达5.3%的mAP50:95增益。其创新性体现在:1) 通过P2层重构解决小目标特征丢失问题;2) C2fGCU的动态门控机制为复杂背景下的特征筛选提供新思路;3) DMSF模块为多尺度检测任务提出可扩展的融合范式。该研究为无人机实时检测系统提供了兼顾精度与效率的解决方案,其模块化设计可适配YOLOv11/YOLOv12等后续框架。未来工作将探索GCU机制在3D点云检测中的迁移应用。
生物通微信公众号
知名企业招聘