
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DSR-YOLO:基于轻量化YOLOv8架构的多尺度行人检测优化模型及其在复杂场景中的应用
【字体: 大 中 小 】 时间:2025年05月06日 来源:Cognitive Robotics CS8.4
编辑推荐:
针对复杂背景和尺度变化导致的行人检测难题,研究人员提出DSR-YOLO模型,通过集成DCNv4(可变形卷积)、SimAM(无参数注意力机制)和RFB(感受野模块),在CityPersons数据集上实现mAP@50提升14.9%,推理速度保持10.63ms,为自动驾驶系统(ADAS)提供高效解决方案。
在城市交通场景中,行人检测是自动驾驶系统(ADAS)的核心挑战之一。复杂背景、多尺度变化以及频繁遮挡等问题严重影响了传统检测模型的准确性。尽管基于深度卷积神经网络(DCNNs)的方法如YOLO系列已取得进展,但在密集城市环境中仍存在漏检和误检率高的问题。尤其当行人穿着季节性服装或处于动态遮挡状态时,现有模型的鲁棒性显著下降。
针对这些技术瓶颈,研究人员开发了DSR-YOLO模型,其创新性体现在三个维度:首先,通过DCNv4模块动态调整卷积核形状,有效捕捉行人姿态变化;其次,引入SimAM注意力机制无需增加参数即可抑制背景干扰;最后,新增160×160检测头与RFB模块协同增强小目标检测能力。实验表明,该模型在CityPersons数据集上mAP@50达到70.25%,较基线YOLOv8n提升14.9%,同时保持2.31M参数量和10.63ms推理速度。
关键技术包括:1)采用DCNv4替代标准卷积,通过可学习偏移量提升特征提取灵活性;2)构建混合C2f模块(C2fSD和C2fSC),在浅层结合SimAM与DCNv4,深层保留标准卷积保证效率;3)使用WIoUv3损失函数动态调整边界框回归权重;4)在NVIDIA Jetson Xavier边缘设备部署时,TensorRT量化使FP16精度下帧率达55.92f/s。
研究结果部分显示:
结论指出,DSR-YOLO通过层级式创新实现了精度与效率的平衡:DCNv4解决形变适应问题,SimAM优化特征选择,而WIoUv3则完善了回归损失计算。该研究不仅为复杂场景行人检测提供了新范式,其轻量化设计更推动了ADAS系统在边缘计算场景的落地应用。值得注意的是,在Caltech数据集的重度遮挡子集上50.5%的FPPI值,揭示了模型在极端场景仍有优化空间,这为后续研究指明了方向。
生物通微信公众号
知名企业招聘