DSR-YOLO:基于轻量化YOLOv8架构的多尺度行人检测优化模型及其在复杂场景中的应用

【字体: 时间:2025年05月06日 来源:Cognitive Robotics CS8.4

编辑推荐:

  针对复杂背景和尺度变化导致的行人检测难题,研究人员提出DSR-YOLO模型,通过集成DCNv4(可变形卷积)、SimAM(无参数注意力机制)和RFB(感受野模块),在CityPersons数据集上实现mAP@50提升14.9%,推理速度保持10.63ms,为自动驾驶系统(ADAS)提供高效解决方案。

  

在城市交通场景中,行人检测是自动驾驶系统(ADAS)的核心挑战之一。复杂背景、多尺度变化以及频繁遮挡等问题严重影响了传统检测模型的准确性。尽管基于深度卷积神经网络(DCNNs)的方法如YOLO系列已取得进展,但在密集城市环境中仍存在漏检和误检率高的问题。尤其当行人穿着季节性服装或处于动态遮挡状态时,现有模型的鲁棒性显著下降。

针对这些技术瓶颈,研究人员开发了DSR-YOLO模型,其创新性体现在三个维度:首先,通过DCNv4模块动态调整卷积核形状,有效捕捉行人姿态变化;其次,引入SimAM注意力机制无需增加参数即可抑制背景干扰;最后,新增160×160检测头与RFB模块协同增强小目标检测能力。实验表明,该模型在CityPersons数据集上mAP@50达到70.25%,较基线YOLOv8n提升14.9%,同时保持2.31M参数量和10.63ms推理速度。

关键技术包括:1)采用DCNv4替代标准卷积,通过可学习偏移量提升特征提取灵活性;2)构建混合C2f模块(C2fSD和C2fSC),在浅层结合SimAM与DCNv4,深层保留标准卷积保证效率;3)使用WIoUv3损失函数动态调整边界框回归权重;4)在NVIDIA Jetson Xavier边缘设备部署时,TensorRT量化使FP16精度下帧率达55.92f/s。

研究结果部分显示:

  1. DCNv4效果验证:对比实验表明DCNv4使mAP@50提升至62.42%,推理时间仅增加0.59ms。
  2. 注意力机制优化:SimAM以零参数量代价实现64.1% mAP@50,显著优于CBAM和CA模块。
  3. 多尺度检测增强:RFB模块使80×80和160×160头部的遮挡目标检测精度提升3.71%。
  4. 边缘设备适配:在Jetson Xavier上,FP16量化模型功率降至2388mW,满足实时性需求。

结论指出,DSR-YOLO通过层级式创新实现了精度与效率的平衡:DCNv4解决形变适应问题,SimAM优化特征选择,而WIoUv3则完善了回归损失计算。该研究不仅为复杂场景行人检测提供了新范式,其轻量化设计更推动了ADAS系统在边缘计算场景的落地应用。值得注意的是,在Caltech数据集的重度遮挡子集上50.5%的FPPI值,揭示了模型在极端场景仍有优化空间,这为后续研究指明了方向。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号