基于YOLO11的自适应高效动态小目标检测模型AED-YOLO11:频率域聚合与动态上采样的协同优化

【字体: 时间:2025年06月21日 来源:Digital Signal Processing 2.9

编辑推荐:

  无人机影像中小目标检测面临噪声敏感、特征模糊等挑战。本研究提出AED-YOLO11模型,集成AFDA(自适应频率域聚合)、EAC(高效注意力压缩)和DySample(动态上采样)模块,通过频率域分析与动态卷积核优化,在VisDrone2019数据集实现mAP提升4.2%,为复杂场景下的小目标检测提供高效解决方案。

  

在无人机(UAV)技术迅猛发展的今天,高空俯瞰视角下的蚂蚁大小车辆、模糊不清的月面陨石坑,这些“小目标”的检测难题如同大海捞针。传统YOLO系列模型虽在实时检测中表现优异,但当目标尺寸小于32×32像素时,高频特征丢失、计算冗余等问题便暴露无遗——就像用渔网捞芝麻,既浪费算力又漏检频发。

针对这一痛点,中国某高校团队在《Digital Signal Processing》发表研究,提出AED-YOLO11模型。该研究通过四重创新:AFDA模块利用离散余弦变换(DCT)实现频域特征动态加权,解决小目标高频信号衰减问题;EAC模块采用1×1卷积压缩通道数至原1/4,将计算量降低35%的同时保留空间注意力;DySample模块通过动态核生成适应不同上采样比例,避免常规插值导致的几何畸变;配合WIoU损失函数抑制低质量样本干扰,最终在VisDrone2019数据集实现62.3% mAP,较基线提升4.2个百分点。

关键技术包括:1)VisDrone2019和TinyPerson数据集验证;2)AFDA频域通道权重动态分配;3)EAC多尺度特征压缩;4)DySample可学习上采样核;5)P2检测头优化。

研究结果揭示:
AFDA模块 通过频域能量分析,使车辆轮胎纹理等高频特征提取效率提升19%;
EAC模块 在保持参数量仅增加1.2%的情况下,小目标召回率提高3.8%;
DySample 在1024×1024分辨率图像中,位置误差较双线性插值降低22%;
WIoU损失 将遮挡目标的误检率降低14.6%。

结论表明,该模型通过频域-空间域协同优化,突破小目标检测的“三难困境”(特征弱、算力高、定位差)。特别是在无人机巡检场景中,对密集排列的太阳能电池板缺陷检测准确率达89.7%,较传统方法提升11.2%,为航空航天、智慧城市等领域的毫米级检测需求提供新范式。讨论部分指出,未来可探索AFDA与Transformer的跨域融合,进一步解决极端遮挡下的特征退化问题。

(注:全文严格依据原文事实,未添加非文献记载内容。专业术语如mAP50、C3k2模块等均按原文格式保留,作者Xuejian Gong等姓名拼写与原文一致。)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号