LUFE-Net:一种适用于复杂场景的轻量级无人机空中目标特征增强网络
《Optics & Laser Technology》:LUFE-Net: A lightweight UAV aerial object feature enhancement network for complex scenarios
【字体:
大
中
小
】
时间:2025年12月25日
来源:Optics & Laser Technology 4.6
编辑推荐:
无人机图像目标检测中提出轻量级模型LUFE-Net,通过动态过滤器主干网络、自适应混合模块、剪枝策略和特征蒸馏框架,在VisDrone2019-DET等数据集上实现2.5%-3.2%的检测精度提升,同时降低41.9%计算复杂度和51.3%参数量。
无人机航拍图像检测领域长期面临三大核心挑战:首先是小目标误检率高、漏检严重的问题,其次是小尺寸图像处理时计算资源消耗过大,第三是轻量化模型与高性能之间的平衡难题。针对这些痛点,作者团队创新性地构建了LUFE-Net检测框架,通过四个核心模块的协同优化实现了检测精度与计算效率的双重突破。
在模型架构设计方面,动态过滤器网络(DynamicFilterNet)作为核心主干网络,采用频域处理技术替代传统卷积操作。该架构通过空间频率转换将图像特征从二维平面映射到频域空间,在保留全局信息的同时将计算量降低41.9%。这种设计特别适用于无人机航拍场景中广泛存在的密集小目标问题,能有效捕捉车辆、行人等不同距离目标的空间分布特征。
自适应混合模块(AMBlock)针对多尺度目标特征融合难题,创新性地引入动态卷积核形状调整机制。该模块通过分析输入图像的局部纹理特征和全局上下文关系,自动调整卷积核的宽高比(从1:1到3:1),使小目标特征提取更精准,大目标上下文关联更紧密。实验表明,这种动态卷积机制在CoDrone数据集上的检测准确率提升了2.8个百分点。
模型压缩环节采用LAMP剪枝策略,通过分层自适应 magnitude-based 剪枝方法,在保证mAP50指标稳定的前提下,成功将模型参数量压缩51.3%。特别值得关注的是其双阶段剪枝机制:第一阶段针对浅层网络高频特征进行选择性保留,第二阶段对深层网络进行渐进式参数删减,这种分层次优化策略避免了传统全参数剪枝可能导致的特征退化问题。
多尺度特征蒸馏框架的引入显著提升了模型对复杂场景的适应能力。该模块通过构建教师-学生网络体系,将预训练模型的深层特征与浅层特征进行知识迁移。教师网络采用轻量化动态过滤器网络提取全局特征,学生网络通过特征蒸馏学习到更高效的局部特征表示,这种双向优化机制使模型在TinyPerson数据集上的小目标检测准确率提升了3.2%。
实验验证部分选取了三个具有代表性的无人机航拍数据集:VisDrone2019-DET包含15类目标,涵盖城市道路、农田等多种场景;TinyPerson专注于行人检测,目标尺寸从1/8到1/2图像高度不等;CoDrone数据集包含车辆、骑行者等复杂移动目标。对比实验显示,LUFE-Net在VisDrone数据集上mAP50达到82.5%,较现有最优模型提升2.5%,同时计算资源消耗降低41.9%。在更严苛的TinyPerson数据集上,模型将小目标(尺寸小于1/8图像)的检测准确率从78.3%提升至81.5%,参数量减少51.3%。
技术实现路径具有显著创新性:首先在特征提取阶段,动态过滤器网络通过频域特征转换,将传统卷积的时空局部性扩展到全局关联,特别适合处理无人机航拍中存在的大范围场景变化和密集小目标问题。其次在特征融合阶段,自适应混合模块采用动态卷积核调整技术,根据不同尺度目标的特征分布自动适配卷积核形态,解决传统固定卷积核无法有效处理多尺度目标特征融合的痛点。
性能优化方面,LAMP剪枝策略的创新体现在其分层次渐进式优化机制。不同于传统全连接层的批量剪枝,该策略首先对高频特征通道进行选择性保留,再通过动态阈值对中频特征进行参数裁剪,最后对低频全局特征实施渐进式压缩。这种分阶段优化既保证了关键特征保留,又避免了参数突变导致的模型性能下降。
在工程实现层面,模型通过动态调整计算资源的分配比例,实现了性能与效率的平衡。具体表现为:在特征提取阶段通过频域转换减少计算量,在特征融合阶段通过动态卷积核调整提升效率,在模型压缩阶段通过分层剪枝保留核心参数。这种多维度的协同优化策略,使得模型在保持85.2%原始精度的情况下,参数量减少超过50%,推理速度提升超过40%。
实际应用验证显示,该模型在复杂场景下的泛化能力显著优于传统方法。例如在VisDrone数据集中,面对暴雨天气导致的低光照图像,模型通过动态调整卷积核形状和剪枝强度,使小目标检测成功率保持在91%以上。在CoDrone数据集的夜间航拍场景测试中,模型通过多尺度特征蒸馏,有效克服了低光照条件下目标特征弱化的问题,平均检测精度达到89.7%。
技术优势体现在三个维度:计算效率上,相比RT-DETR等现有实时检测模型,推理速度提升42%;模型体积上,参数量减少51.3%,模型大小压缩至原型的三分之一;检测精度上,在保持模型轻量化的同时,mAP50指标提升2.5%-3.2%,特别是在小目标检测(尺寸小于1/8图像)方面表现尤为突出。这种综合性能的提升为无人机航拍检测系统提供了理想的解决方案。
研究团队在模型泛化能力方面进行了深入探索,通过设计多尺度特征蒸馏框架,实现了跨数据集的性能迁移。实验表明,在未经充分标注的CoDrone数据集上,模型通过迁移学习仅需300张样本即可达到基准模型的90%检测精度,充分证明了其强大的泛化能力。这种端到端的轻量化设计,使得模型能够适应不同分辨率(从640×480到2048×2048)的航拍图像输入,满足多样化应用场景的需求。
未来工作方向主要集中在三个方面:首先优化动态过滤器网络在三维空间中的应用,为立体检测提供支持;其次开发自适应学习率调度机制,提升模型在非平稳环境中的鲁棒性;最后探索联邦学习框架下的模型持续进化,使系统能够在不新增标注数据的前提下持续提升检测能力。这些技术延伸方向为无人机检测系统提供了持续进化的技术路径。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号