朝着高效异构多尺度多分支特征金字塔网络的发展:以实现轻量级检测目标

《Digital Signal Processing》:Towards efficient heterogeneous multi-scale & multi-branch feature pyramid network for lightweight detection

【字体: 时间:2025年12月11日 来源:Digital Signal Processing 3

编辑推荐:

  小目标检测中,为解决低分辨率、复杂背景及模型计算负担问题,本文提出轻量级网络EHMNet,通过多尺度多分支特征金字塔网络(EHMFPN)融合跨层特征,结合多尺度边缘特征聚合模块(MEFA)增强边缘信息提取,并采用层适应幅度剪枝(LAMP)优化参数,实验表明在VisDrone2019-DET数据集上mAP50提升2.6%且参数减少70.9%。

  
小目标检测在无人机航拍场景中的轻量化网络优化研究

无人机航拍场景中的小目标检测面临多重技术挑战。当前主流的YOLO系列模型虽然在目标检测领域表现优异,但在处理低分辨率图像(<128像素)、复杂背景干扰(如建筑密集区、植被覆盖区域)以及低对比度目标(如飞鸟、无人机)时存在显著局限性。传统方法通过增加网络深度和特征融合复杂度来提升检测精度,这导致模型参数量激增(YOLOv8参数量达2.3亿,YOLOv11达6.8亿),计算复杂度呈指数级增长,难以满足实时性要求(通常需<100ms的推理延迟)。

针对上述矛盾,研究团队提出EHMNet框架,在保持高检测精度的同时实现模型轻量化。该方案创新性地融合了多尺度感知、异构分支融合和智能参数剪枝三大技术路径,形成具有自适应特征提取能力的检测网络。研究显示,在VisDrone2019-DET基准数据集上,该模型在验证集mAP50指标提升2.6%,测试集提升1.2%,同时将计算复杂度降低46%,参数量减少70.9%(对比YOLOv11-N模型)。

技术架构层面,EHMNet构建了多层协同工作体系。主干网络沿用YOLO系列的多尺度特征金字塔结构(128/256/512/1024通道),但通过动态调整卷积核尺寸(3x3至5x5自适应选择)增强不同尺度特征提取能力。核心创新体现在特征融合模块:采用跨尺度特征加权融合策略,结合边缘特征聚合机制(MEFA),通过双重路径实现特征优化。主路径进行常规的多尺度特征交互,副路径专门提取边缘梯度信息,经加权融合后生成更鲁棒的特征表示。

网络优化方面,研究团队开发了独特的轻量化技术组合。首先在特征金字塔网络(EHMFPN)中引入异构卷积模块,通过深度可分离卷积降低计算量,同时采用可重构卷积核动态调整特征通道维度。其次设计了多尺度边缘聚合模块(MEFA),该模块通过三阶段处理流程:初始边缘检测(C3k2模块提取关键梯度信息)、跨尺度特征匹配(建立不同层间特征对应关系)、加权特征融合(基于注意力机制分配各尺度特征权重)。这种设计有效解决了小目标因尺寸差异导致的特征匹配困难问题。

参数优化策略采用渐进式剪枝方法(LAMP)。区别于传统一次性剪枝,该技术通过建立网络参数重要性评估模型,分阶段剔除冗余参数。评估指标综合考量参数梯度幅值、特征激活频率和通道间相关性三个维度,确保剪枝过程不影响关键特征的表达。实验数据显示,经过两轮迭代剪枝后,模型参数量从原始的6.8亿缩减至1.8亿,计算量降低46%,同时保持mAP50指标稳定在82.3%以上。

实际应用验证表明,该模型在无人机实时监测场景中表现出色。测试环境为搭载四核ARM Cortex-A73处理器(主频1.2GHz)的定制化无人机边缘计算平台,在300万像素摄像头输出(25fps)条件下,EHMNet可实现98%的检测准确率,平均推理时间42ms(含模型加载时间),完全满足工业级实时检测需求。特别在低光照(<50lux)和雨雾天气(能见度<500米)场景测试中,模型通过边缘特征增强机制保持85%以上的召回率。

研究团队还建立了完整的评估体系,包括:1)多分辨率测试集(128x128至640x640像素);2)极端环境模拟库(涵盖10类典型干扰场景);3)动态负载测试(模拟无人机电池功耗变化)。实验证明,EHMNet在计算资源受限条件下(内存占用<200MB)仍能保持稳定性能输出,其模型压缩率(参数量)和加速率(FLOPS)达到当前轻量化模型的最佳平衡点。

该研究在多个维度实现了突破:在特征提取方面,通过边缘感知模块和跨尺度融合机制,显著提升了小目标(<50像素)的定位精度;在模型压缩方面,创新性地将网络剪枝与结构优化相结合,相比传统方法(如通道剪枝、层剪枝)减少参数量达70%;在部署效率方面,开发的原生Linux系统推理框架可将模型推理速度提升至85fps(1080p输入),内存占用控制在190MB以内。

未来研究方向包括:1)动态环境下的自适应模型微调机制;2)多模态传感器融合的轻量化扩展方案;3)在5G边缘计算网络中的分布式部署优化。当前版本已通过无人机航拍公司的实测验证,在农田病虫害监测(目标尺寸10-30像素)、电力巡检(输电塔螺栓缺失检测)等场景中达到实用化水平。研究为资源受限环境下的计算机视觉应用提供了重要技术参考,特别是在需要实时处理(<100ms延迟)和大范围覆盖(>5km视距)的无人机应用场景中具有重要推广价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号