DHEE-DETR:一种用于实时车辆检测的动态混合与边缘增强网络
《Digital Signal Processing》:DHEE-DETR: A Dynamic Hybrid and Edge Enhancement Network for Real-Time Vehicle Detection
【字体:
大
中
小
】
时间:2025年10月24日
来源:Digital Signal Processing 3
编辑推荐:
针对实时车辆检测中多尺度输入处理不足和边缘信息丢失的问题,本文提出DHEE-DETR框架,通过动态混合网络DH-Net实现自适应卷积核选择与跨层特征融合,结合多尺度边缘增强分支MSEFE提取浅层边缘特征,并引入动态稀疏注意力机制DSA优化全局注意力计算。实验表明在BDD100K数据集上mAP0.5提升3.3%,推理速度提升21%,计算成本降低22.6%。
在自动驾驶等众多领域中,实时且精确的车辆检测技术发挥着至关重要的作用。随着智能交通系统的发展,对车辆识别的需求日益增长,特别是在复杂多变的环境中,如城市道路、恶劣天气条件等,车辆检测技术不仅要具备高精度,还必须实现快速响应。当前,主流的检测模型——Detection Transformer(DETR)虽然在目标检测任务中表现出色,但在处理车辆检测时仍面临诸多挑战。这些挑战主要体现在对多尺度、复杂输入数据的处理能力不足,以及在检测过程中容易丢失边缘信息,从而影响目标的定位和识别效果。
为了应对这些挑战,本文提出了一种新的检测框架,名为Dynamic Hybrid and Edge Enhancement DETR(DHEE-DETR)。该框架结合了动态混合主干网络、多尺度边缘信息增强机制以及动态稀疏注意力模型,旨在提升车辆检测的精度与效率。DHEE-DETR的提出,是对现有检测方法的一次重要改进,特别是在面对复杂输入数据和边缘信息丢失问题时,具有显著的优势。
首先,DHEE-DETR引入了新的主干网络DH-Net,该网络采用动态深度可分离卷积核权重机制。这种机制能够使模型更灵活地适应不同尺度的输入数据,从而有效提升对多尺度目标的检测能力。传统的卷积神经网络(CNN)在处理复杂环境时存在一定的局限性,主要是因为其卷积核的固定大小难以应对目标尺度的多变性。此外,CNN的层间信息融合效率较低,导致在处理多尺度输入时无法同时提取细节和全局信息。因此,DH-Net通过引入动态卷积核选择机制,解决了这一问题,使得模型在面对复杂输入时具备更强的适应性和检测能力。
其次,DHEE-DETR设计了多尺度边缘信息增强分支(MSEFE),该分支能够从网络的浅层特征中提取多尺度的边缘信息,并通过与深层语义信息的互补融合,提升边缘特征的表达能力。边缘信息在目标检测中具有重要作用,它能够帮助模型更精确地识别目标的形状和位置。然而,传统的检测方法在提取边缘信息时往往存在不足,特别是在处理复杂输入数据时,容易丢失边缘特征。MSEFE通过结合水平和垂直Sobel算子,从浅层特征中提取更丰富的边缘信息,并将其传递到主干网络的不同尺度特征图中,从而实现低层边缘特征与高层语义特征的互补融合。这种融合机制不仅提升了目标识别的精度,还增强了模型对复杂输入的适应能力。
第三,DHEE-DETR提出了动态稀疏注意力模型(DSA),该模型能够通过基于查询的方式,筛选出图像中与目标相关性较低的区域,从而实现稀疏注意力计算,提升注意力机制对边缘信息的感知能力。传统的注意力机制通常需要对整个图像进行全局计算,这不仅导致计算成本较高,还可能影响检测的效率。而DSA则通过引入动态稀疏计算机制,仅关注与目标强相关的区域,从而减少不必要的计算,提高模型的运行效率。同时,该模型还能够通过边缘与语义信息的互补利用,增强对目标形状和位置的感知能力,从而提升检测的准确性。
最后,本文提出的DHEE-DETR框架,不仅解决了多尺度输入和边缘信息丢失的问题,还通过动态混合主干网络和稀疏注意力机制,实现了对车辆检测任务的更高效处理。实验结果显示,DHEE-DETR在BDD100K数据集上的表现优于现有方法,尤其是在检测精度和运行效率方面取得了显著的提升。与RT-DETR相比,DHEE-DETR在mAP0.5和mAP0.5-0.95指标上分别提升了3.3%和2.2%,同时将计算成本降低了22.6%,推理速度提高了21%。这一结果表明,DHEE-DETR在保持高精度的同时,具备更强的运行效率,能够更好地满足自动驾驶等实时应用的需求。
为了验证所提出方法的有效性,本文在BDD100K数据集上进行了实验。BDD100K是一个广泛使用的车辆检测数据集,包含10个类别标签:公交车、小型车辆、交通标志、行人、自行车、卡车、摩托车、汽车、火车和骑行者。由于“火车”类别的样本数量较少,本文在实验中去除了所有与该类别相关的标注框。在BDD100K数据集中,共有大量的标注数据,涵盖了各种复杂环境下的车辆图像,包括不同的光照条件、天气状况以及车辆的大小变化。这些数据为验证DHEE-DETR的性能提供了良好的基础。
在实验过程中,本文采用了多种评估指标,包括mAP0.5和mAP0.5-0.95,以衡量检测模型的精度。mAP0.5表示在检测精度达到0.5时的平均精度,而mAP0.5-0.95则衡量在不同交叠阈值下的平均精度。这两个指标能够全面反映检测模型在不同场景下的性能表现。实验结果显示,DHEE-DETR在mAP0.5和mAP0.5-0.95指标上均优于RT-DETR,表明其在检测精度方面具有明显优势。此外,本文还评估了模型的计算成本和推理速度,以衡量其运行效率。计算成本是指模型在处理图像时所需的计算资源,而推理速度则衡量模型在单位时间内能够处理多少图像。实验结果显示,DHEE-DETR的计算成本降低了22.6%,推理速度提高了21%,表明其在运行效率方面也具有显著优势。
为了进一步验证DHEE-DETR的性能,本文还与多种现有的检测方法进行了比较。这些方法包括传统的CNN基检测器、基于Transformer的检测器以及改进型的RT-DETR。通过对比实验,本文发现DHEE-DETR在多个指标上均优于这些方法,特别是在处理复杂输入数据和边缘信息丢失问题时表现更为出色。这表明,DHEE-DETR在提升车辆检测精度的同时,也能够有效降低计算成本,提高推理速度,从而更好地满足实时应用的需求。
此外,本文还分析了DHEE-DETR在不同环境下的表现。在城市道路环境中,车辆的种类繁多,大小差异较大,光照条件复杂,这些因素都可能影响检测的精度。而DHEE-DETR通过引入动态混合主干网络和多尺度边缘信息增强机制,能够更好地适应这些复杂环境,提升检测的鲁棒性。在恶劣天气条件下,如雨、雪、雾等,车辆的边缘信息可能受到干扰,传统的检测方法在这些条件下往往表现不佳。而DHEE-DETR通过动态稀疏注意力机制,能够有效过滤出与目标强相关的区域,从而提升对边缘信息的感知能力,提高检测的准确性。
本文提出的DHEE-DETR框架,不仅在理论上有创新,而且在实际应用中也表现出色。通过动态混合主干网络、多尺度边缘信息增强机制和动态稀疏注意力模型的结合,DHEE-DETR能够更高效地处理车辆检测任务,同时提升检测的精度和效率。这一框架的提出,为未来车辆检测技术的发展提供了新的思路和方法,具有重要的应用价值。
在实际应用中,DHEE-DETR能够广泛应用于自动驾驶、智能交通监控、车辆跟踪等领域。这些领域对车辆检测技术的要求较高,不仅需要高精度,还必须具备快速响应的能力。DHEE-DETR通过优化检测流程,提高了检测效率,使得模型能够在实际应用中发挥更大的作用。此外,DHEE-DETR还能够适应不同的硬件平台,如GPU和TPU,这使得其在不同场景下的部署更加灵活。
本文的研究工作还得到了多位研究人员的贡献。Ruixuan Wang负责概念化、方法设计、软件开发、验证、数据管理、撰写初稿以及项目管理。Dinghai Wu参与了概念化、验证、数据管理、撰写审阅与编辑以及监督工作。Guoquan Ren负责软件开发、形式分析、数据管理以及监督工作。Xu Xia和Zhigang Ren则参与了调查、数据管理以及项目管理。这些研究人员的共同努力,使得DHEE-DETR能够在理论和实践上取得显著的成果。
综上所述,DHEE-DETR的提出,为解决车辆检测中的多尺度输入和边缘信息丢失问题提供了一种新的方法。通过动态混合主干网络、多尺度边缘信息增强机制和动态稀疏注意力模型的结合,DHEE-DETR能够在保持高精度的同时,有效降低计算成本,提高推理速度,从而更好地满足实时应用的需求。这一框架的提出,不仅推动了车辆检测技术的发展,也为未来的智能交通系统提供了有力的技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号