CIFormer:基于交叉交互Transformer的陶瓷砖表面缺陷检测方法
《Array》:CIFormer: Cross Interaction TransFormer for surface defect detection in ceramic tile
【字体:
大
中
小
】
时间:2025年10月23日
来源:Array 4.5
编辑推荐:
本研究针对陶瓷砖表面微小复杂缺陷难以检测及缺陷与正常区域视觉相似度高的技术难题,提出了一种交叉交互Transformer(CIFormer)模型。通过设计粗细粒度交互模块(CFGI)捕获细微缺陷特征,并结合自适应跨尺度注意力模块(ACSA)实现多尺度信息融合,在陶瓷砖缺陷检测基准数据集上达到77.5%的mAP50,较现有最优方法提升2.8%,为工业智能制造提供高效可靠的质检解决方案。
在工业智能制造领域,陶瓷砖表面缺陷检测一直是质量控制的关键环节。然而,由于陶瓷砖表面缺陷具有微小复杂、与正常区域视觉相似度高等特点,传统检测方法往往力不从心。人工检测效率低且易出错,而现有的基于深度学习的检测方法在处理微小缺陷和相似纹理区分时仍存在明显局限。这些挑战严重制约了陶瓷砖生产质量的提升,亟需开发更精准高效的检测技术。
针对这一难题,清远职业技术学院机电与汽车工程系的罗芳、张伟雄等研究团队在《Array》期刊上发表了题为"CIFormer: Cross Interaction TransFormer for surface defect detection in ceramic tile"的研究论文。该研究创新性地提出了一种交叉交互Transformer架构,通过两个核心模块协同工作攻克检测难题:粗细粒度交互模块(CFGI)专注于捕获微小缺陷特征,自适应跨尺度注意力模块(ACSA)则负责区分视觉相似的缺陷与正常区域。
研究团队采用阿里天池竞赛的陶瓷砖数据集进行验证,该数据集包含5388张图像,涵盖边缘异常、角异常、白点缺陷等六类典型缺陷。通过滑动窗口方法将原始图像处理为640×640像素尺寸,最终获得57,535张训练图像。实验采用精确率(Precision)、召回率(Recall)和平均精度均值(mAP)作为评估指标,在PyTorch框架下使用Adam优化器进行模型训练。
关键技术方法包括:基于CSP-Net的主干网络进行特征提取;设计选择性状态空间注意力(SSSA)机制实现O(N)复杂度的高效计算;采用多尺度融合策略整合不同粒度特征;利用膨胀卷积构建跨尺度特征金字塔。这些技术的结合使模型在保持实时检测速度(123.4 FPS)的同时,显著提升了检测精度。
研究结果方面,CIFormer在陶瓷砖数据集上表现出色,达到77.5%的精确率、72.7%的召回率和77.5%的mAP50,全面超越YOLOv5s、YOLOv8s等主流检测模型。特别是在微小缺陷检测方面,CFGI模块通过双记忆通路机制,有效捕获了传统方法难以识别的微裂纹、针孔等缺陷。可视化结果对比显示,CIFormer能够准确标注出其他方法遗漏的细小缺陷,同时显著降低误报率。
跨数据集验证进一步证明了模型的泛化能力。在NEU-DET钢铁缺陷数据集上,CIFormer取得91.2%的mAP,在夹杂物、裂纹等六类缺陷检测中均达到最优性能,表明该架构在不同工业质检场景下具有良好的适应性。
消融实验深入分析了各模块的贡献。单独使用CFGI模块使mAP50提升1.5%,而ACSA模块带来1.3%的改进。两个模块协同工作时产生协同效应,最终性能提升达到2.4%,验证了模块设计的合理性和有效性。
讨论部分指出,虽然CIFormer在陶瓷砖缺陷检测中表现优异,但在低对比度缺陷(如白点缺陷)和光照变化条件下的检测仍有提升空间。未来研究将聚焦于光照不变特征学习、纹理感知先验整合等方向,进一步提升模型在实际工业环境中的鲁棒性。
该研究的创新价值在于:首次将交叉交互注意力机制引入工业质检领域;提出的CFGI和ACSA模块为微小缺陷检测提供了新思路;在保持实时性的同时显著提升检测精度,为工业智能制造提供了可靠的技术支撑。随着进一步优化和推广应用,CIFormer有望在陶瓷、钢铁等多种工业产品质量检测中发挥重要作用,推动工业质检向智能化、精准化方向发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号