自适应净化与关联驱动的图异常检测框架ACCD-GAD:突破同配性假设下的表征污染难题

《Neurocomputing》:Adaptive cleaning and correlation-driven graph anomaly detection

【字体: 时间:2025年11月04日 来源:Neurocomputing 6.5

编辑推荐:

  本文针对图异常检测(GAD)中因同配性假设导致的正常节点表征污染问题,提出了一种新型无监督框架ACCD-GAD。该框架通过自适应净化策略动态调整节点清洗概率,结合跨尺度特征与结构相关性分析(CS-FSCA)模块,在十个基准数据集上实现了较现有方法最高4.91%的AUROC提升,为复杂场景下的异常检测提供了更可靠的解决方案。

  
在社交网络、网络安全和电子商务等领域,属性图已成为描述复杂系统的重要工具。这类图将实体表示为带有属性的节点,将交互关系表示为边。图异常检测(Graph Anomaly Detection, GAD)作为属性图分析中的关键任务,旨在识别那些显著偏离典型行为的节点。由于标记异常数据成本高昂且稀缺,无监督方法特别是基于图神经网络(Graph Neural Networks, GNNs)的方法成为主流。然而,现有GNN方法存在两大局限:在同配性假设下,异常邻居会导致正常节点表征污染;仅依赖重建误差难以检测伪装良好的异常或复杂正常节点。
针对这些挑战,浙江师范大学智能教育技术及应用浙江省重点实验室的研究团队在《Neurocomputing》上发表了题为"Adaptive cleaning and correlation-driven graph anomaly detection"的研究论文,提出了一种名为ACCD-GAD的新型无监督框架。该框架通过自适应净化策略减少表征污染,并整合典型相关性分析来评估跨特征和结构维度的局部与全局表征一致性,为异常检测提供更可靠的信号。
研究方法主要包括两个核心技术:自适应净化技术通过动态调整节点清洗概率,基于实时嵌入更新来减少正常节点的误删;跨尺度特征与结构相关性分析(CS-FSCA)模块通过典型相关性分析评估节点在特征和结构维度上局部与全局表征的一致性。实验在十个基准数据集上进行,采用AUROC等指标评估性能。
相关研究
早期GAD研究主要依赖LOF、Radar等传统浅层方法,这些方法使用手工特征和基于距离的度量,但缺乏捕捉图数据深层语义信息的能力。随着图神经网络的发展,基于GNN的自编码器(GAE)被广泛应用,使用重建误差作为异常指标,但存在表征污染和评估标准单一的问题。
理论基础
研究将静态属性图定义为G=(V,E,X),其中V为节点集合,E为边集合,X为节点属性矩阵。GAD的核心目标是学习高质量节点表征,实现可靠的异常评分,这需要解决获取无污染表征和设计兼顾属性与结构偏差的评估标准两个关键问题。
方法实现
ACCD-GAD采用两阶段流程:预训练阶段使用自适应净化策略,使编码器在净化环境中学习稳健的正常模式;第二阶段使用预训练编码器生成多尺度表征,并通过CS-FSCA模块进行相关性分析。自适应净化策略根据节点属性动态调整清洗概率,而CS-FSCA通过典型相关性分析评估特征和结构维度的一致性。
实验验证
在十个基准数据集上的实验表明,ACCD-GAD在AUROC指标上显著优于现有方法,最高提升达4.91%。参数敏感性分析和消融研究验证了自适应净化策略和CS-FSCA模块的有效性,表明该方法在不同图类型和异常场景下均具有稳健性。
结论
ACCD-GAD通过自适应净化策略有效缓解了异常引起的表征污染,结合重建误差与跨尺度特征结构相关性分析,提供了更全面的异常检测框架。该研究为图异常检测提供了新的思路和方法,在社交垃圾检测、异常用户行为识别等领域具有重要应用价值。未来工作可进一步探索动态图中的异常检测问题。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号