基于YOLOv9的钢材表面缺陷检测优化:先进骨干模型的角色与性能评估
【字体:
大
中
小
】
时间:2025年10月10日
来源:Frontiers in Artificial Intelligence 4.7
编辑推荐:
本综述系统评估了六种先进骨干网络(ResNet50、GhostNet、MobileNetV4、FasterNet、StarNet、RepViT)在YOLOv9框架下对钢材表面缺陷检测的性能。研究通过NEU-DET和GC10-DET数据集验证发现,RepViT在综合检测精度(mAP50达68.8%)和召回率方面表现最优,而GhostNet在计算效率(仅41.2M参数、190.2 GFLOPs)方面最具优势。文章为工业实时检测场景提供了骨干网络选择的实证依据,并深入分析了不同缺陷类型(如裂纹Cr、夹杂In)的检测瓶颈与优化方向。
钢材表面缺陷检测是制造业质量控制的核心环节,传统方法如人工检测和电磁检测存在精度低、适应性差等局限。随着计算机视觉技术的发展,基于深度学习的方法逐渐成为主流。YOLO(You Only Look Once)系列算法因其高效的单阶段检测特性,被广泛应用于工业缺陷检测领域。本研究聚焦YOLOv9框架,通过系统集成六种代表性骨干网络,探究其在钢材表面缺陷检测中的优化潜力与方法论创新。
研究以YOLOv9-C为基线模型,替换其原生GELAN骨干网络,引入ResNet50、GhostNet、MobileNetV4、FasterNet、StarNet和RepViT六种结构。所有骨干网络均通过1×1卷积层统一输出通道数(P3:256, P4:512, P5:1024),以适配YOLOv9-C的颈部和检测头结构。训练过程中保留辅助可逆分支以优化梯度传播,推理阶段则移除该分支以提升效率。
ResNet50通过残差连接缓解梯度消失问题,但参数量达68.9M,计算成本较高。GhostNet采用特征线性生成机制,显著降低计算冗余,参数量仅41.2M。MobileNetV4基于通用逆瓶颈(UIB)模块和深度可分离卷积,平衡精度与效率。FasterNet引入部分卷积(PConv)减少内存访问开销,适合边缘设备部署。StarNet通过星型操作实现非线性特征交互,在轻量化设计中保持较强表征能力。RepViT结合自注意力与卷积优势,通过结构重参数化提升推理效率。
实验基于NEU-DET和GC10-DET数据集展开。NEU-DET包含6类缺陷(裂纹Cr、夹杂In、斑块Pa、点蚀Ps、氧化皮Rs、划痕Sc),图像分辨率200×200。GC10-DET涵盖10类缺陷,包括月牙裂、焊痕等复杂类型。训练采用SGD优化器,初始学习率0.01,引入马赛克增强(mosaic=1.0)和混合增强(mixup=0.15)策略。评估指标包括mAP50、精确率、召回率、F1-score、参数量(Params)和计算量(GFLOPs)。
在NEU-DET数据集上,RepViT取得最优综合性能(mAP50=68.8%, F1=0.65),尤其在夹杂(In)和氧化皮(Rs)检测中表现突出(AP分别达69.9%和50.5%)。FasterNet召回率最高(70.5%),显著提升裂纹(Cr)检测能力(mAP50=32.6%)。GhostNet以41.2M参数和190.2 GFLOPs实现高效推理,但细微缺陷(如Cr)检测精度受限。MobileNetV4呈现“高精确低召回”特性(精确率73.5%,召回率59.6%),适合低误报场景。ResNet50虽深度特征提取能力强,但参数量大(68.9M)且对细长缺陷敏感度不足。
GC10-DET跨数据集验证表明,RepViT保持最优泛化能力(mAP50=56.0%),而YOLOv9-C原生模型在复杂背景中精确率最高(67.1%)。三类缺陷(月牙裂Cr、夹杂In、滚压坑Rp)在所有骨干网络中均表现较差,主要受限于小尺度、低对比度和极端长宽比等特性导致的IoU敏感性和NMS冲突。
YOLOv5-m框架下的消融实验进一步验证结论普适性:FasterNet召回率最高(63.7%),GhostNet在轻量化场景中优势显著,MobileNetV4仍保持精确率优先特性(69.1%)。
骨干网络的选择需结合缺陷特性与部署环境:RepViT适合高精度要求的复杂缺陷检测,GhostNet和MobileNetV4适用于计算受限的实时场景,FasterNet在召回率敏感任务中表现优异。研究揭示了缺陷检测中的共性挑战——微小、低对比度及极端长宽比缺陷(如Cr、In、Rp)易因近阈IoU误差和NMS抑制导致漏检。数据集特性(如空间先验分布、背景纹理)会显著影响骨干网络的精度-召回权衡。
本研究为工业表面缺陷检测提供了骨干网络的实证选择框架。未来工作将拓展至更复杂数据集,探索无NMS范式和改进定位表示(如定向框)以缓解密集细长缺陷的检测冲突。同时需针对类别不平衡和噪声环境优化数据增强与损失函数设计,进一步提升模型在真实工业场景中的鲁棒性和适用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号