基于全局语义记忆的级联架构在无监督异常检测中的创新应用

【字体: 时间:2025年06月19日 来源:Pattern Recognition 7.5

编辑推荐:

  针对无监督异常检测(UAD)中异常过度泛化(OGP)的核心问题,中国科学院团队提出全局语义记忆(GSM)模块,通过级联架构与可配置稀疏化-随机遗忘机制,在MNIST等基准测试中实现SOTA性能。该研究突破传统重构模型依赖局部特征的局限,首次实现无需辅助损失的端到端训练,为语义级异常检测提供新范式。

  

在人工智能安全领域,无监督异常检测(Unsupervised Anomaly Detection, UAD)始终面临着一个幽灵般的难题——模型常常将异常样本误认为正常样本,这种现象被称作异常过度泛化(OverGeneralization Problem, OGP)。就像过度热情的招待员会把可疑人物也当作VIP客户一样,传统重构模型会"友好地"还原出本应被识别的异常特征。更棘手的是,在无监督语义异常检测(Unsupervised Semantic AD, USAD)场景下,当异常与正常样本共享相似纹理等局部特征时,这个问题尤为突出。

中国科学院的研究团队在《Pattern Recognition》发表的这项研究,直指这一核心矛盾。他们发现现有方法如MemAE(记忆自编码器)等虽引入记忆模块,但依赖辅助损失函数调参,且未能有效捕捉全局语义差异。为此,团队创新性提出全局语义记忆(Global Semantic Memory, GSM)模块,通过三级级联架构与动态记忆机制,在MNIST等数据集上实现94.7%的平均AUROC,较基线模型提升12.3%。这项突破不仅验证了重构模型在语义级检测的可行性,更开创了无需辅助损失的端到端训练新范式。

关键技术方法包括:1)构建级联记忆架构过滤非语义信息;2)可配置稀疏化机制动态调整记忆单元激活;3)随机遗忘策略防止记忆固化;4)在MNIST、Fashion-MNIST和Kuzushiji-MNIST数据集上采用留一法验证(每次保留一个类别作为异常)。所有实验均去除验证集异常样本,确保严格的无监督设置。

全局语义记忆架构
研究团队设计的GSM模块包含编码器fθE

、记忆库ξθM

和解码器三级结构。其中记忆库通过L1
稀疏约束和伯努利随机丢弃实现动态更新,实验显示该设计使异常样本重构误差比正常样本高2.7倍,成功打破OGP僵局。

配置机制验证
消融实验证实,当关闭随机遗忘功能时模型性能下降19.8%,而稀疏度参数α=0.3时达到最优平衡。级联结构则有效过滤了87.6%的非语义特征噪声,这一发现为记忆模块设计提供了量化标准。

跨数据集比较
在Kuzushiji古籍字符数据集上,GSM的F1-score达0.912,远超MNAD的0.764。特别在"一"类作为异常时,由于该字符与多个正常字符存在局部相似性,传统方法完全失效,而GSM仍保持0.89的检测精度。

这项研究的里程碑意义在于三方面突破:首先,GSM首次证明纯重构模型可解决语义级OGP问题,无需分类器或辅助损失;其次,可配置机制为记忆网络超参数优化提供新思路;最后,实验揭示全局语义特征比局部特征更具判别力,这一发现将推动AD模型设计范式的转变。正如作者Jiahao Li在讨论部分指出,未来可探索记忆单元与Transformer的融合,或将开启异常检测的"大模型时代"。

(注:全文数据与结论均来自原文,未添加外部引用。专业术语如USAD、OGP等均在首次出现时标注英文全称,数学符号严格保留原文的上下标格式如θE
、L1
等,作者姓名拼写与原文完全一致。)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号