集成空间通道注意力机制的轻量级多尺度动态特征聚焦网络,用于自动驾驶目标检测
《Digital Signal Processing》:Lightweight multi-scale dynamic feature focusing network integrating spatial channel attention mechanism for autonomous driving object detection
【字体:
大
中
小
】
时间:2025年11月24日
来源:Digital Signal Processing 3
编辑推荐:
针对复杂驾驶环境中多尺度目标、遮挡和小目标检测难题,提出LMSDF-Net,创新性地融合时空自注意力机制(SCSA)、多尺度动态特征聚焦模块(MSDFFM)和小目标检测层,显著提升检测精度。实验表明,在Udacity和SODA10M数据集上,其mAP50分别达到86.2%和63.6%,较YOLOv11n提升4.5%和0.6%,且参数量更低。
在当前快速发展的智能交通系统中,自动驾驶技术正逐步从理论研究走向实际应用。随着人工智能的不断进步,自动驾驶车辆通过集成各种传感器、计算设备和软件系统,能够有效地识别和规避障碍物,从而提升行车安全性和效率。在这一过程中,环境感知作为核心技术之一,其准确性直接决定了自动驾驶系统的可靠性和智能化水平。而在这其中,目标检测作为环境感知的关键组成部分,承担着识别道路上各类目标(如车辆、行人、交通标志等)的任务,是实现自动驾驶安全运行的重要保障。
然而,现有的目标检测模型在设计时往往以通用性为主要目标,这在一定程度上导致了其在复杂驾驶环境中的表现不尽理想。复杂环境中的多尺度目标、遮挡现象以及背景干扰等问题,都会显著影响检测的准确度。尤其是在自动驾驶的实际应用场景中,这些挑战更为突出。例如,在雨天或雾天,图像的清晰度下降,目标轮廓变得模糊;在夜间或隧道等低光条件下,图像噪声增加,对比度降低;而在城市复杂路况中,行人、非机动车和车辆密集分布,常伴有遮挡和小目标的出现,这些因素都可能降低检测精度,甚至引发系统误判。因此,针对这些具体问题,设计一种能够有效应对复杂环境的目标检测网络显得尤为重要。
本文提出了一种新的目标检测网络——LMSDF-Net,旨在提升自动驾驶系统在复杂环境下的检测性能。该网络基于YOLOv11架构进行优化,引入了多种创新机制以解决上述问题。首先,为了缓解背景干扰的影响,我们设计了一个名为“空间通道自注意力(Spatial Channel Self-Attention, SCSA)”的模块。该模块结合了局部注意力和全局注意力机制,并引入了位置编码技术,以增强网络对关键空间位置和通道信息的关注,从而更有效地捕捉目标的关键特征,提升检测精度。
其次,为了增强网络对多尺度目标的识别能力,我们开发了一个“多尺度动态特征聚焦模块(Multi-Scale Dynamic Feature Focusing Module, MSDFFM)”。该模块通过多尺度卷积与动态最大相对图卷积的结合,实现了对多尺度信息的融合与强化。这种设计不仅有助于网络更好地理解不同尺寸的目标,还能有效提升其对局部细节和空间关系的感知能力,从而在面对复杂环境中的多尺度目标时表现出更强的适应性。
此外,为了提高对小目标的识别能力,我们在网络中加入了专门的小目标检测层。小目标由于尺寸较小,往往在传统检测模型中容易被忽略,特别是在复杂背景或密集场景中。通过引入这一层,LMSDF-Net能够更专注于小目标的特征提取,提高其在实际应用中的鲁棒性。
为了验证LMSDF-Net的有效性,我们在两个广泛使用的自动驾驶数据集——Udacity和SODA10M上进行了实验。实验结果显示,LMSDF-Net在这些数据集上均表现出高度竞争力。具体而言,在mAP50指标下,LMSDF-Net分别达到了86.2%和63.6%的准确率,而在mAP50:95指标下,分别达到了56.3%和44.0%。这些结果表明,LMSDF-Net在复杂场景下的检测能力显著优于其他主流模型,如YOLOv11n。与YOLOv11n相比,LMSDF-Net在mAP50指标下提升了4.5%和0.6%,在mAP50:95指标下则提升了3.5%和0.6%。同时,该模型的参数数量也低于基准模型,这使得其在保持高性能的同时,具备更强的实时性。
除了在标准数据集上的表现,我们还对LMSDF-Net在BDD100K数据集的六个不同天气和光照子集上的性能进行了评估。BDD100K是一个包含多种复杂环境条件的自动驾驶数据集,涵盖了雨天、雪天、夜间、隧道等多种场景。实验结果表明,LMSDF-Net在所有子集上的表现均优于基准模型,显示出其在不同环境条件下的鲁棒性和适应性。这一结果进一步验证了LMSDF-Net在复杂驾驶环境中的实用性。
本文的主要贡献在于以下几个方面:首先,我们提出了一种结合局部和全局注意力机制的SCSA模块,该模块通过位置编码技术,增强了网络对关键空间位置和通道信息的关注,从而提高了目标检测的准确性。其次,我们设计了MSDFFM模块,该模块通过多尺度卷积和动态最大相对图卷积的结合,提升了网络对多尺度目标的识别能力。第三,我们引入了专门的小目标检测层,以增强网络对小目标的识别能力。最后,我们构建了LMSDF-Net网络,并在多个自动驾驶数据集上进行了广泛的实验验证,结果表明该模型在复杂场景下的表现优于现有主流模型,同时保持较低的参数量,具有良好的实际应用潜力。
在方法部分,我们详细描述了LMSDF-Net的结构和各个模块的工作原理。首先,我们介绍了LMSDF-Net的整体框架,该框架基于YOLOv11的结构进行优化,并引入了上述三种创新模块。接着,我们分别对SCSA模块、MSDFFM模块和小目标检测层进行了深入解析。SCSA模块通过结合局部和全局注意力机制,能够在不同尺度下对关键特征进行有效聚焦。MSDFFM模块则通过多尺度信息融合和动态特征提取,增强了网络对复杂场景的适应能力。小目标检测层则专门针对小目标的识别问题,通过调整网络结构和特征提取方式,提高了对小目标的检测效果。
在实验和结果部分,我们首先描述了实验所使用的数据集配置和评估指标。Udacity和SODA10M是两个广泛应用于自动驾驶研究的数据集,它们涵盖了多种复杂驾驶环境,如城市道路、高速公路、夜间行驶等。在这些数据集中,我们评估了LMSDF-Net的检测性能,并与其他主流模型进行了对比。实验结果表明,LMSDF-Net在多个指标上均优于其他模型,尤其是在mAP50和mAP50:95指标下表现突出。此外,我们还进行了消融实验,通过逐步引入各个模块,分析了它们对模型性能的具体影响。结果表明,SCSA模块、MSDFFM模块和小目标检测层的加入均对模型性能有显著提升,其中SCSA模块在提升检测准确度方面贡献最大。
在讨论部分,我们分析了LMSDF-Net在复杂自动驾驶场景中的设计思路和实现效果。我们指出,多尺度目标、遮挡现象和背景干扰是影响目标检测准确度的主要因素。因此,在设计LMSDF-Net时,我们特别关注这些挑战,并通过引入相应的模块来解决这些问题。此外,考虑到自动驾驶对实时性要求较高,我们对模型进行了轻量化设计,使其能够在保持高性能的同时,满足实际应用中的计算需求。实验结果也表明,LMSDF-Net在不同天气和光照条件下的表现均优于其他模型,显示出其在实际应用中的广泛适应性。
在结论部分,我们总结了LMSDF-Net的主要设计思想和实验结果。通过引入SCSA模块和MSDFFM模块,以及专门的小目标检测层,LMSDF-Net在复杂环境下的目标检测性能得到了显著提升。同时,模型的参数量低于基准模型,这使其在实际部署中更具优势。我们的实验结果表明,LMSDF-Net不仅在标准数据集上表现出色,而且在不同天气和光照条件下的复杂场景中也具有良好的适应性。这为未来自动驾驶系统中目标检测技术的发展提供了新的思路和方法。
在作者贡献声明部分,我们明确了每位作者在本研究中的具体贡献。Kunpeng Wu主要负责软件开发、形式分析、概念设计、初稿撰写、验证和审阅。Yunfeng Xu则负责验证、监督、资金获取、审阅和项目管理。Junpo Zhang主要负责可视化和审阅工作。这些贡献表明,本研究是一个团队合作的成果,每位作者都在项目的不同阶段发挥了重要作用。
最后,在竞争利益声明部分,我们声明本研究的作者没有已知的与研究内容相关的竞争性财务利益或个人关系,这确保了研究的客观性和公正性。综上所述,LMSDF-Net作为一种针对复杂驾驶环境设计的目标检测网络,不仅在技术上具有创新性,而且在实际应用中展现出良好的性能和适应性,为自动驾驶技术的发展提供了有力的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号