RLA-YOLO:一种轻量级且准确的实时钢板缺陷检测方法

《Digital Signal Processing》:RLA-YOLO: A Lightweight and Accurate Method for Real-Time Steel Plate Defect Detection

【字体: 时间:2025年10月31日 来源:Digital Signal Processing 3

编辑推荐:

  针对钢铁表面缺陷检测中存在的多尺度、不规则形状和模糊边缘问题,本文提出基于YOLOv8n的RLA-YOLO改进模型。通过引入APSDP模块增强全局与局部特征融合,C2F-Res-DRB模块优化多尺度特征提取与长程依赖建模,以及BSE-Loss动态调整样本权重,显著提升检测精度(mAP50达0.763)和计算效率(105.4 FPS),并在NEU-DET和GC10-DET数据集上验证有效性。

  在现代工业中,钢铁制造是不可或缺的一部分,广泛应用于生物医学工程、汽车制造、机械加工等多个领域。然而,在生产、运输或装配过程中,表面缺陷如裂纹、划痕和夹杂物等常常出现,若未能及时检测,将严重影响产品质量和后续加工流程。随着生产速度的提升,对高效质量检测的需求也日益增长。目前,许多工厂仍然依赖人工检测,这种方式不仅成本高昂,而且主观性强,难以满足快速交付的要求。因此,开发适用于工业应用的高效表面缺陷检测算法,已成为智能制造中的关键任务。

近年来,端到端的深度学习方法在工业表面缺陷检测方面展现出显著的优势。与传统的图像处理技术相比,后者通常需要手动提取颜色、纹理和形状等特征,而深度学习模型能够从大量数据中自动捕捉复杂的模式和特征。这不仅消除了对不同缺陷类型显式规则的需求,还大大提高了缺陷检测的自动化程度和准确性。目前,主流的检测方法可以分为一类和两阶段检测模型。两阶段检测器,如Faster R-CNN和Cascade R-CNN,虽然在检测精度方面表现优异,但其架构复杂,推理速度较慢,因此不太适合实时工业应用。相比之下,一类检测器,如YOLO系列和DETR系列,能够在单次前向传播中完成分类和定位任务,提供更快的检测速度,更适合生产线上快速检测的需求。因此,近年来的研究重点逐渐转向对一类检测模型的优化。

在一类检测器中,传统的基于锚点的方法,如YOLOv5,往往难以覆盖所有先验框,导致样本匹配效率低下。相比之下,YOLOv8采用无锚点的检测方式,避免了复杂的锚点设置,展现出更好的灵活性,特别是在处理具有较大长宽比差异的目标时,例如钢铁表面缺陷。为了在保持检测速度的同时,实现高效的推理和部署,本文采用了轻量级的YOLOv8n作为基础模型。该模型具有较高的速度,非常适合边缘部署,为后续的优化提供了坚实的基础。

尽管YOLOv8在一般的检测任务中表现良好,但其模块和损失函数并未专门针对钢铁缺陷进行设计。在实际应用场景中,许多复杂的缺陷存在,如图1(b)所示,这些缺陷的挑战主要包括:(1) 变化的尺度,缺陷的像素面积可以从非常小的坑洞如“表面坑”到较大的块状区域如“块状缺陷”,使得跨尺度检测变得困难;(2) 不规则的形状,例如“网状裂纹”表现出密集且不规则的网络状裂纹,而“划痕”则常常呈现为长条形或条纹状,难以准确地用标准边界框进行匹配;(3) 模糊的边缘,一些缺陷如“压入鳞片”与背景之间的对比度较低,“夹杂物”则表现出边界不清晰,这给精确的定位带来了挑战。这些因素显著增加了检测的难度,常常导致漏检、误报和边界框重叠等问题。因此,需要进一步改进模型,以提升其在钢铁表面缺陷检测中的效果。

为了解决上述挑战,已有研究探索了多种优化策略。例如,引入注意力机制以增强模型对关键区域的关注能力;设计多尺度特征融合结构以扩大感受野,提升对不同尺度缺陷的检测能力;以及对损失函数进行优化,以提高检测性能。本文在这些研究的基础上,结合工业应用的实际需求,提出了三种针对性的改进措施,以进一步提升YOLOv8n在钢铁缺陷检测中的表现。

首先,我们引入了自适应参数共享扩张金字塔(APSDP)模块,以替代YOLOv8n中的空间金字塔池化-快速(SPPF)模块。SPPF模块虽然能够增强模型对不同尺度特征的提取能力,但在使用最大池化时会导致一定的特征损失。APSDP模块通过结合参数共享扩张卷积(PSD-Conv)和自适应细粒度通道注意力机制(AFGC-Attention),不仅扩大了感受野,还增强了对多尺度特征的提取能力,同时通过参数共享策略降低了模型的复杂度。此外,与AFGC-Attention机制相结合,该模块提升了全局与局部特征的融合效果,突出了关键特征,抑制了冗余信息,从而实现了更加准确和鲁棒的缺陷检测。

其次,我们引入了C2F-Res-DRB模块,以替代YOLOv8n中的C2F模块。C2F模块在原有结构中对长距离依赖和稀疏特征的建模能力有限,因此我们引入了扩张重参数化块(DRB)模块,该模块结合了扩张卷积与重参数化技术,以增强模型对多规模特征的提取和建模能力。通过将DRB模块与残差连接机制相结合,我们提出了C2F-Res-DRB模块。该模块不仅扩大了感受野,加强了特征融合,还提升了模型在检测不规则缺陷方面的能力,有助于实现更稳定的训练过程。

最后,我们引入了基于滑动加权和指数加权移动平均(EWMA)的BSE损失函数,以替代传统的二元交叉熵损失(BCE-Loss)。BCE-Loss在处理类别不平衡和困难样本时存在一定的局限性,而BSE损失函数通过引入滑动加权机制,基于IoU(交并比)的自适应加权方式,动态调整每个样本的贡献,使模型更加关注困难样本。此外,通过应用EWMA技术,对IoU阈值μ进行平滑处理,提升了训练的稳定性。

为了验证所提出的方法,我们使用了两个数据集进行实验。第一个数据集是东北大学收集的热轧钢带表面缺陷数据库(NEU-DET),作为主要的测试数据集。第二个数据集是GC10-DET,用于进一步的辅助验证,以评估所提出模型的泛化能力。两个数据集均可从本文研究的GitHub仓库中获取。

NEU-DET数据集包含了热轧钢带表面的六种类型缺陷,其中就包括“网状裂纹”和“划痕”等。这些缺陷的检测对模型的准确性和鲁棒性提出了较高的要求。通过在该数据集上的实验,我们发现所提出的RLA-YOLO模型在检测精度和召回率方面均优于现有方法,同时保持了较低的计算开销(7.5 GFLOPs)和较高的检测速度(105.4 FPS)。此外,在GC10-DET数据集上的进一步实验也验证了该模型在检测复杂缺陷方面的提升能力。

综上所述,本文提出了一种基于改进YOLOv8n的金属表面缺陷检测方法,通过引入APSDP模块、C2F-Res-DRB模块和BSE损失函数,有效解决了钢铁表面缺陷检测中的关键问题。这些改进不仅提升了模型的检测精度和召回率,还增强了其在实际工业环境中的适用性。此外,本文所提出的方法在保持模型轻量化的同时,实现了较高的检测速度和较低的计算开销,为工业自动化检测提供了有力的技术支持。通过在多个数据集上的实验验证,我们证明了该方法的有效性和实用性,为未来的工业检测研究提供了新的思路和方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号