
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于图像块聚合与判别快速自监督学习的工业缺陷检测方法FastPAD
【字体: 大 中 小 】 时间:2025年06月16日 来源:Neurocomputing 5.5
编辑推荐:
针对现有自监督图像异常检测方法中合成异常样本真实性不足、推理速度慢等问题,研究人员提出基于图像块聚合与判别(FastPAD)的快速检测方法。通过异常样本合成校正模块(ASCM)提升样本真实性,采用非卷积特征处理与快速注意力特征融合模块(FAFFM)实现113 FPS高速推理,在MVTecAD和VisA数据集上分别达到98.5%和98.8%的像素级AUC-ROC,为工业质检提供高效解决方案。
在工业质检领域,图像异常检测如同"火眼金睛"的质检员,但传统方法面临两大困境:一是缺陷样本稀少导致监督学习"营养不良",二是无监督学习因缺乏异常知识而"误判连连"。更棘手的是,现有自监督方法合成的缺陷样本像"粗糙的赝品",容易让模型学到错误知识,加之卷积神经网络(CNN)的复杂计算让检测速度成为瓶颈。这些问题严重制约了工业场景下的实时质检需求。
渤海大学的研究团队在《Neurocomputing》发表的这项研究,提出革命性的FastPAD方法。该方法通过三大技术创新实现突破:首先,异常样本合成校正模块(ASCM)像"精修师"般提升合成缺陷的真实性;其次,摒弃传统卷积操作,采用图像块聚合模块(PAM)将特征图处理速度提升至113 FPS;最后,通过快速注意力特征融合模块(FAFFM)实现深浅特征互补,配合自适应加权融合策略(ADWF)优化检测精度。研究选用MVTecAD和VisA两大工业数据集验证,这些数据集包含15类产品超过70种缺陷类型,所有异常样本均带有像素级标注。
【总体结构】
FastPAD采用六模块协同架构:ASCM负责生成逼真异常样本,PAM通过16×16图像块划分实现特征降维,FAFFM用多层感知机(MLP)结构融合深浅特征,特征校正模块(FCM)完成跨域特征对齐,判别模块(PDM)执行像素级异常判定,最终由评分融合模块(SFM)输出检测结果。
【关键技术】
【实验结果】
在MVTecAD数据集上,FastPAD取得98.5%像素级AUC-ROC和93.9% AUC-PRO,超越对比方法CutPaste 4.2个百分点;VisA数据集上达到98.8% AUC-ROC。推理速度达113 FPS,比同类CNN方法快3倍以上。消融实验显示,单独移除ASCM会使检测精度下降6.7%,证实其校正机制的关键作用。
【结论与意义】
该研究突破性地将图像块思想引入异常检测领域,首次实现检测精度与速度的双重提升。其技术价值体现在三方面:工业层面,113 FPS的实时检测能力满足生产线需求;算法层面,非卷积特征处理为轻量化网络设计提供新思路;理论层面,ASCM的校正机制为生成式数据增强提供借鉴。研究获得国家自然科学基金(61503038)等多项资助,相关代码已开源,有望推动工业质检向实时化、精准化方向发展。
(注:全文严格依据原文事实撰写,专业术语如AUC-ROC(受试者工作特征曲线下面积)、AUC-PRO(精确召回曲线下面积)等均保留原文表述;作者名Yihang Gao等保留原始拼写;技术模块缩写如ASCM等首次出现时均标注全称)
生物通微信公众号
知名企业招聘