基于核集的补丁级代理指标学习,用于精确异常定位

《Engineering Applications of Artificial Intelligence》:Patch-level proxy metric learning with coresets for precise anomaly localization

【字体: 时间:2025年11月19日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  基于记忆库的工业图像异常检测方法存在预训练特征与工业数据特性不匹配导致过泛化或过特殊化问题,本文提出投影层优化记忆库表示空间的ProxyCore方法,结合伪标签和代理度量学习(nSoftmax损失)提升异常检测精度及定位准确性,在MVTecAD、VisA、MPDD等数据集上验证有效性。

  工业图像异常检测是现代制造业中一项关键的技术,其核心目标在于识别生产过程中出现的异常模式,并准确确定这些异常的位置。随着人工智能技术的快速发展,异常检测方法在工业领域的应用也逐渐增多,特别是在产品质量控制和自动化检测方面。传统的异常检测方法通常依赖于监督学习,但由于工业数据中异常样本数量极少,这种模式并不适用于工业场景。因此,近年来研究者们更加关注无监督或半监督的异常检测技术,其中记忆库(memory bank)方法因其无需额外标注数据即可实现较高的检测性能而受到广泛重视。

然而,现有的记忆库方法在实际应用中仍然存在一些显著的局限性。这些方法通常基于预先训练的卷积神经网络(CNN)提取图像特征,然后将这些特征存储在记忆库中,用于后续的异常识别。虽然这种方法在一定程度上提高了检测效率,但其性能仍然受到特征提取器对工业图像适应能力的限制。许多预训练模型是在自然图像数据集上进行训练的,它们学习到的特征虽然在通用物体分类任务中表现良好,但在工业异常检测任务中却无法准确捕捉到特定的异常模式。这种不匹配会导致记忆库中的特征簇无法正确表示正常数据,从而影响异常检测的准确性。

在异常检测过程中,特征簇的组织方式对于区分正常与异常模式至关重要。如果特征簇过于宽泛,可能会导致正常数据中包含异常样本,造成误判;反之,如果特征簇过于狭窄,则可能将正常数据中的微小变化误判为异常,从而增加误报率。这种现象在工业图像异常检测中尤为明显,因为工业数据通常具有复杂的纹理和结构,且异常类型多样,这使得模型在学习过程中需要更加精确地识别和区分正常与异常模式。此外,异常检测任务还要求模型能够进行精确的定位,即在图像中准确标记出异常区域。然而,现有的方法往往难以实现这一点,特别是在面对细微异常时,定位的准确性会受到显著影响。

为了解决这些问题,本文提出了一种名为ProxyCore的新方法。该方法通过优化特征表示空间,使模型能够更有效地学习工业数据的特性,并在记忆库中形成更加清晰和准确的特征簇。与传统的记忆库方法相比,ProxyCore引入了基于核心集(coreset)的伪标签和代理度量学习(proxy metric learning)技术,从而提高了特征簇的区分能力,避免了过泛化和过特化的现象。具体来说,ProxyCore通过一个学习到的投影层,将图像块的嵌入特征映射到一个新的表示空间中,该空间能够更好地反映工业数据的分布特性。在训练过程中,该投影层被优化以使相似的嵌入特征更加接近,而不相似的嵌入特征则更加远离,从而形成更加清晰的特征簇边界。

此外,ProxyCore还引入了嵌入级别的增强技术,以提高模型的鲁棒性和泛化能力。传统的图像增强方法在异常检测任务中可能会引入人工异常,影响模型的准确性。而ProxyCore则在图像块度量学习阶段直接对嵌入特征添加高斯噪声,使模型能够更好地适应图像中的微小变化。这种增强方式有助于模型在面对未见过的正常数据时,仍然能够准确分类,从而减少误报率。同时,ProxyCore在实验中表现出了优于现有方法的性能,特别是在使用AUPRC(Area Under the Precision-Recall Curve)指标进行评估时,该指标对定位任务中的误报率非常敏感。

本文的实验部分涵盖了多个具有挑战性的工业异常检测基准数据集,包括MVTecAD、ViSA和MPDD。这些数据集涵盖了不同的工业场景,其中包含正常图像和异常图像,以及对应的地面真实掩码图像。通过在这些数据集上的实验,本文验证了ProxyCore在异常检测和定位任务中的有效性。实验结果表明,ProxyCore在检测性能和定位精度方面均优于现有的主流方法,如PatchCore、PaDiM和SPADE。这表明,ProxyCore在处理工业图像异常检测任务时具有更强的适应能力和更高的准确性。

从方法的结构来看,ProxyCore的主要组成部分包括一个预训练的CNN模型、一个投影层以及一个基于核心集的伪标签生成机制。在训练阶段,CNN模型用于提取图像块的特征嵌入,然后通过核心集选择最具代表性的特征样本作为伪标签。这些伪标签随后被用于代理度量学习,通过nSoftmax损失函数优化特征表示空间,使特征簇更加清晰和准确。在推理阶段,模型从测试图像中提取特征,并与记忆库中的特征进行比较,以判断是否存在异常。通过这种方式,ProxyCore能够在不依赖额外标注数据的情况下,实现较高的检测性能。

在实际应用中,工业图像异常检测需要面对多种挑战,包括数据不平衡、特征不匹配以及定位精度要求高等。因此,本文提出的方法不仅在检测性能上有所提升,还通过优化特征表示空间,提高了模型在复杂工业场景中的适应能力。此外,ProxyCore的结构设计使得模型能够更有效地处理不同的异常类型,从而提高了整体的检测效果。通过引入基于核心集的伪标签和代理度量学习,ProxyCore能够在不增加训练数据负担的情况下,实现更高的检测精度和定位能力。

总的来说,本文提出的方法ProxyCore在工业图像异常检测领域具有重要的应用价值。它通过优化特征表示空间和引入伪标签机制,有效解决了现有方法在特征不匹配和定位精度方面的不足。实验结果表明,ProxyCore在多个工业异常检测数据集上的表现优于现有方法,特别是在AUPRC指标下的检测效果更加显著。该方法不仅能够提高异常检测的准确性,还能够增强模型在复杂工业场景中的鲁棒性和泛化能力,为工业自动化检测提供了一种新的解决方案。未来的研究可以进一步探索ProxyCore在更多工业场景中的应用,并优化其在不同数据集上的适应能力,以实现更广泛的实际应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号