
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向嵌入式系统的轻量化实时目标检测模型YOLO-C:结构重参数化与大核卷积的协同优化
【字体: 大 中 小 】 时间:2025年06月03日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对工业场景中小样本数据集检测性能不足及高分辨率输入嵌入式部署难题,研究团队提出基于结构重参数化技术优化的YOLO-C模型。通过重构HGNetv2主干网络、共享权重检测头等创新设计,在7个数据集上实现140+FPS的实时检测性能,其中蒸馏压缩版在NEU-DET数据集以3.03%参数量超越RT-DETR精度2.6%,为工业缺陷检测提供高效解决方案。
在计算机视觉领域,实时目标检测技术如同城市的"火眼金睛",支撑着自动驾驶、工业质检等关键应用。然而当前最先进的YOLO系列模型面临两大困境:一方面,工业场景数据获取困难导致小样本数据集检测性能骤降;另一方面,高分辨率输入(如640×640)在嵌入式设备部署时遭遇算力瓶颈,难以满足25FPS的实时性要求。更棘手的是,Transformer架构虽在COCO等大数据集表现优异,却因硬件兼容性差、训练成本高而难以落地。这些矛盾催生了一个核心科学问题:如何在不牺牲精度的前提下,打造适应工业场景的轻量化实时检测器?
中国研究人员提出的YOLO-C模型给出了创新解决方案。该研究首先解剖了现有YOLO系列的三大技术路线:基于梯度路径的ELAN(YOLOv7)、结构重参数化的RepVGG(YOLOv6)和大核卷积的RTMDet。研究团队创造性采用"三管齐下"策略:将HGNetv2主干网络进行手术式改造,用结构重参数化模块替代大核深度卷积,既保留大感受野优势又提升部署效率;设计共享权重检测头缓解小样本过拟合;引入蒸馏剪枝技术压缩模型至3.03%参数量。这些突破使YOLO-C在《Engineering Applications of Artificial Intelligence》发表的论文中展现出非凡价值。
关键技术方法包括:1)基于7个异构数据集(含工业缺陷数据集NEU-DET和自建矿井罐道数据集)的对比实验;2)结构重参数化技术实现训练-推理架构转换;3)动态标签分配策略优化;4)模型蒸馏与TensorRT量化部署技术。
【Reparameterization technology】
研究揭示结构重参数化技术的"变形金刚"特性:训练时通过多分支结构(如ACNet的3×3+1×3+3×1并联卷积)增强特征提取,推理时融合为单一3×3卷积。这种"训练-推理异构"设计使YOLO-C在NEU-DET数据集mAP提升2.3%。
【Design idea of YOLO-C】
创新性地将HGNetv2的stem层替换为RepConv模块,消除大核卷积的部署障碍。实验表明该设计使640×640输入下的推理速度提升27%,同时保持98.6%的原精度。
【Network architecture】
采用"轻主干+精 Neck"架构:Backbone融合RepVGG的线性结构和ELAN的梯度流设计;Neck部分引入跨阶段局部注意力机制,在PCB缺陷数据集上使小目标召回率提升5.8%。
【Datasets】
在样本量仅1,800的NEU-DET数据集上,YOLO-C-nano版本以1.8M参数量达成74.3% AP50,显著优于RT-DETR的71.7%。其蒸馏版更创下嵌入式设备148FPS的纪录。
研究结论指出,YOLO-C成功破解了工业检测领域的"三难困境"(小样本、高分辨率、低算力)。通过结构重参数化与大核卷积的协同设计,既保持了大感受野优势,又将计算复杂度降低至RT-DETR的6.14%。特别值得注意的是,该研究提出的共享检测头策略使小样本场景下AP50波动降低42%,验证了参数共享对数据稀缺场景的适应性。这些突破不仅为工业质检提供开箱即用的解决方案,更启示未来研究:在模型设计中应当优先考虑部署友好性,而非单纯追求COCO数据集指标。正如论文强调的,YOLO-C的成功实践标志着实时目标检测技术从"实验室精度竞赛"向"工业落地实用"的重要转型。
生物通微信公众号
知名企业招聘