ESA-YOLO:一种基于YOLOv11的高效、考虑尺度因素的交通标志检测算法,适用于恶劣天气条件
《PLOS One》:ESA-YOLO: An efficient scale-aware traffic sign detection algorithm based on YOLOv11 under adverse weather conditions
【字体:
大
中
小
】
时间:2025年11月15日
来源:PLOS One 2.6
编辑推荐:
本文提出了一种基于改进YOLOv11的交通标志检测算法,通过引入Dense Multi-path Feature Pyramid Network(DMFPN)实现多尺度特征高效融合,Context-Aware Gating Block(CAGB)增强小目标检测能力,Adaptive Scene Perception Head(ASPH)提升复杂场景鲁棒性。实验表明,在TT100K和CCTSDB2021数据集上,该算法较YOLOv11的mAP@50分别提升3.8%和2.3%,参数减少20%,且在雨、雪、夜等复杂环境下表现优异。
交通标志检测在自动驾驶和高级驾驶辅助系统中占据着至关重要的位置。随着智能驾驶技术的快速发展,对交通标志检测的准确性和实时性提出了更高的要求。然而,现有算法在处理多尺度目标、小目标识别以及复杂环境下的鲁棒性方面仍面临诸多挑战。为此,本文提出了一种基于改进YOLOv11的交通标志检测算法,旨在提升模型在多尺度和小目标识别方面的性能,同时保持较高的检测精度和较低的计算成本。
### 1. 交通标志检测的重要性与挑战
在实际应用中,交通标志检测系统必须能够应对各种复杂环境,包括光照变化、天气干扰、几何变形以及遮挡等情况。这些挑战使得传统方法在处理交通标志时难以达到理想效果。例如,夜间低光环境会显著降低图像对比度,雨雪天气可能导致图像模糊,而雾气则会减少可见性,使交通标志的纹理和结构信息部分丢失。此外,车辆与交通标志之间的距离变化导致目标在图像中呈现多尺度特征,这对模型的多尺度检测能力提出了更高的要求。因此,如何在保持高效计算的同时,实现对交通标志的精准识别,成为当前研究的核心议题。
现有的检测方法主要分为两类:单阶段检测器和双阶段检测器。双阶段检测器如Faster R-CNN,虽然在检测精度方面表现优异,但其推理速度较慢,难以满足实时性需求。相比之下,单阶段检测器,如YOLO系列,因其在速度与精度之间的良好平衡,成为当前交通标志检测的主流选择。然而,YOLO系列在面对小目标和复杂环境时,仍存在一定的局限性,例如在多尺度特征融合和小目标识别能力上表现不足。
### 2. 算法改进的核心思想
本文提出的ESA-YOLO算法,通过三个关键创新,解决了上述问题。首先,引入了**密集多路径特征金字塔网络(DMFPN)**,该网络能够实现高低层次特征的双向交互,从而有效提升多尺度特征融合能力。传统的特征金字塔网络(FPN)在融合过程中存在单向路径和通道数量不均衡的问题,容易导致特征信息的丢失。而DMFPN通过统一通道调整策略,确保不同尺度特征在融合过程中保持一致,从而提高融合效率,并增强对小目标的识别能力。
其次,设计了**上下文感知门控模块(CAGB)**,该模块通过轻量级的token和通道混合机制,有效地整合了局部与全局的上下文信息。CAGB模块替代了YOLOv11中常见的C3K2结构,能够在不显著增加计算成本的前提下,显著提升模型对小目标的检测能力。这一改进使得模型在复杂场景中具备更强的感知能力,从而减少误检和漏检现象。
最后,提出了**自适应场景感知头(ASPH)**,该模块结合了多尺度特征提取和注意力机制,提升了模型在恶劣天气条件下的鲁棒性。通过在输出阶段引入多尺度注意力机制,ASPH能够更有效地捕捉目标区域的关键信息,同时抑制非目标区域的干扰。这种设计不仅提高了检测精度,还增强了模型在复杂场景中的适应能力。
### 3. DMFPN:增强多尺度特征融合能力
多尺度特征融合是交通标志检测中的关键技术之一。传统方法如FPN、PANet和BiFPN虽然在一定程度上解决了这一问题,但它们在处理复杂场景时仍存在一定的局限性。例如,PANet在特征融合过程中采用单向路径,未能充分利用不同层次的特征信息,导致部分细节丢失。而BiFPN虽然引入了双向信息流,但其计算复杂度较高,难以满足实时性要求。
为了解决这些问题,本文设计了DMFPN。DMFPN通过在特征融合过程中引入多个输入路径,实现了对不同层次特征的充分整合。此外,DMFPN采用动态加权融合机制,根据特征的重要性进行自适应加权,从而提升融合效果。与传统方法相比,DMFPN不仅能够有效提升多尺度目标的检测性能,还能显著降低计算成本。例如,在TT100K数据集上,DMFPN相较于PANet-P345提升了2.2%的mAP@50指标,同时减少了约60%的计算成本。
### 4. CAGB:提升小目标检测能力
小目标检测是交通标志识别中的关键环节,尤其在复杂环境中,小目标往往容易被忽略。为了提升模型对小目标的识别能力,本文设计了CAGB模块。该模块通过融合局部与全局的上下文信息,增强了模型对细节的感知能力。CAGB的结构类似于C2f模块,但其内部设计更加优化。具体来说,CAGB将输入特征分为两个分支:一个直接输出特征,另一个则通过多个CAGM模块进行处理。这种结构不仅提升了模型对小目标的识别能力,还显著降低了计算复杂度。
CAGB模块中的CAGM进一步增强了上下文感知能力。在局部上下文感知阶段,输入特征首先经过1×1卷积层进行通道变换,然后通过ReLU激活的1×3和3×1深度可分离卷积层,提取局部特征信息。在全局上下文感知阶段,采用基于注意力机制的token混合方法,捕捉全局依赖关系。最终,通过卷积门控线性单元(CGLU)对局部和全局特征进行非线性变换和维度调整,从而实现上下文信息的有效整合。
### 5. ASPH:增强复杂环境下的鲁棒性
在实际驾驶环境中,交通标志检测面临着各种挑战,如夜间光照不足、雨雪天气导致的图像模糊、雾气造成的视觉干扰等。为了应对这些复杂情况,本文引入了ASPH模块,该模块结合了多尺度特征提取和注意力机制,使模型能够更有效地聚焦于目标区域,同时抑制背景干扰。
ASPH模块的结构包括两个并行分支:一个用于全局特征提取,另一个用于局部特征提取。全局特征提取分支采用注意力机制,通过横向和纵向的全局平均池化操作,提取长距离依赖信息。局部特征提取分支则采用1×3和3×1的深度可分离卷积操作,以减少计算开销。在两个分支的输出基础上,通过交叉空间学习机制,进一步提升特征融合效果。最终,ASPH模块能够有效提升模型在复杂环境下的检测鲁棒性。
### 6. 实验与结果分析
为了验证ESA-YOLO算法的有效性,本文在两个公开数据集TT100K和CCTSDB2021上进行了广泛的实验测试。TT100K数据集包含大量高分辨率图像,覆盖了多种城市、高速公路和乡村场景,且具有显著的尺度变化特征。CCTSDB2021数据集则包含了不同天气条件下的交通标志图像,如夜间、雨天、雾天、雪天和晴天,进一步验证了模型在复杂环境下的表现。
实验结果显示,ESA-YOLO在TT100K数据集上,相较于YOLOv11n模型,mAP@50提升了3.8%,mAP@50-95提升了3.9%。同时,模型的参数量和计算复杂度与YOLOv11n保持一致,甚至有所减少。在CCTSDB2021数据集上,ESA-YOLO同样表现出色,其mAP@50和mAP@50-95分别提升了2.3%和1.8%。此外,模型在小目标检测方面也表现出显著优势,在XS和S子集的检测任务中,其检测精度和召回率均优于其他主流模型。
为了进一步验证改进模块的效果,本文还进行了消融实验。实验结果表明,DMFPN、CAGB和ASPH分别在mAP@50和mAP@50-95指标上带来了2.2%、1.0%和0.6%的提升。当这三个模块组合使用时,模型在各项指标上均取得最优表现,且计算成本显著降低。
### 7. 可视化结果与模型性能分析
通过可视化结果,本文进一步验证了ESA-YOLO在不同场景下的检测能力。在TT100K数据集的可视化对比中,ESA-YOLO能够成功检测到YOLOv11未能识别的小目标,如“禁止进入”和“靠右行驶”标志。在CCTSDB2021数据集的可视化结果中,ESA-YOLO在夜间、雨天、雾天、雪天等复杂环境下均表现出更强的鲁棒性。例如,在雪天场景中,ESA-YOLO能够检测到YOLOv11遗漏的极小“禁止”标志,并且其置信度显著高于其他模型。
此外,通过热图分析,ESA-YOLO在目标区域的注意力分布更加集中,而YOLOv11则容易受到背景干扰,导致注意力分布不均。这表明,ESA-YOLO在处理复杂场景时,能够更有效地聚焦于交通标志区域,从而提升检测性能。
### 8. 模型的鲁棒性与适用性
本文提出的ESA-YOLO算法不仅在多尺度和小目标检测方面表现出色,还在复杂环境下的鲁棒性方面具有显著优势。实验结果表明,该模型在多种天气条件下均能保持较高的检测精度,包括夜间、雨天、雾天、雪天和晴天。尤其是在雪天和夜间场景中,ESA-YOLO的检测性能显著优于其他主流模型。然而,模型在雾天场景中仍存在一定的精度下降,这表明其在某些极端条件下的鲁棒性仍有待提升。
为了进一步提升模型的适用性,本文建议在未来的改进工作中,增加特定复杂场景的训练数据,如雾霾环境下的交通标志图像,并探索图像预处理技术,如去雾算法,以提升图像质量,从而增强模型在这些环境下的检测能力。此外,还可以通过扩展交通标志数据集,涵盖更多未被广泛研究的类别,以提升模型对不同交通标志的识别能力。
### 9. 结论与展望
本文提出的ESA-YOLO算法在交通标志检测领域实现了多尺度目标识别、小目标检测和复杂环境下的鲁棒性提升。通过DMFPN、CAGB和ASPH三个核心模块的改进,模型在保持计算效率的同时,显著提升了检测精度。实验结果表明,该模型在多个数据集上均表现出优异的性能,尤其是在小目标检测和恶劣天气条件下的表现更为突出。
尽管ESA-YOLO在大多数场景中表现出色,但在某些特定情况下,如雾天环境,模型的检测精度仍存在提升空间。因此,未来的研究方向包括收集更多复杂场景下的数据,优化模型的注意力机制,以及探索更高效的特征融合策略。此外,还可以结合其他先进的深度学习技术,如自监督学习和多模态融合,以进一步提升模型的泛化能力和鲁棒性。
综上所述,本文提出的ESA-YOLO算法为自动驾驶系统中的交通标志检测提供了一个高效且精准的解决方案,具有广泛的应用前景。通过持续优化和扩展,该算法有望在未来实现更全面的交通标志识别能力,从而推动智能驾驶技术的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号