编辑推荐:
当前基于迁移学习的异常检测常忽视已知异常样本。研究人员开展了基于对抗迁移学习的弱监督异常检测(WSAD)研究。实验表明,该算法在多场景下优于现有方法,提升了异常检测性能,为相关领域提供了更有效的检测方案。
在当今数字化时代,数据广泛应用于各个领域,异常检测的重要性愈发凸显。无论是在金融领域防范欺诈行为,还是医疗领域辅助疾病诊断,亦或是工业场景中预防设备故障,异常检测都发挥着关键作用。然而,随着技术的发展,传统的异常检测方法逐渐暴露出诸多问题。
在过去,像主成分分析(PCA)、支持向量机(SVM)和 K 近邻(KNN)等传统机器学习方法在异常检测中占据主导地位。但随着数据复杂度的增加,深度学习技术逐渐兴起。深度学习虽能在复杂场景中实现更精细的特征提取,却对大规模、高质量的数据有着极高的要求。在现实世界里,获取大量优质数据困难重重,而且模型从离线检测环境向在线检测环境转换时,由于操作状态和数据分布的差异,其检测效果会大打折扣。
为了解决这些难题,迁移学习成为了研究的新方向。它可以利用源域的丰富数据,将有价值的信息迁移到数据有限的目标设备上,从而加速模型的开发与部署。不过,目前迁移学习主要应用于分类任务,在异常检测方面的应用还相对有限。而且现有的基于迁移学习的异常检测算法,往往只依赖标记的正常样本,不仅标记过程耗时费力,还难以充分利用少量的已知异常样本信息。
在这样的背景下,东北大学的研究人员开展了一项基于对抗迁移学习的弱监督异常检测(WSAD)研究 。他们提出的算法在多个数据集上进行了实验验证,结果显示该算法在异常检测性能上优于当前的主流方法,这一成果对于提升不同领域的异常检测能力具有重要意义,相关研究成果发表在《Engineering Applications of Artificial Intelligence》上。
研究人员在此次研究中,主要运用了以下几种关键技术方法:首先,利用编码器网络将源域和目标域的样本映射到共享特征空间,实现样本特征提取;其次,引入基于样本的梯度反转策略,用于域适应阶段的对抗学习,优化稀缺异常数据的利用;再者,在弱监督异常检测模块中,结合支持向量数据描述算法(SVDD)和样本特征分布规律,采用基于累积分布函数的权重计算方法,增强对未知样本的利用。
下面详细介绍研究结果:
- 双域平衡集中策略:研究人员提出了一种适用于弱监督异常检测的损失函数,即双域平衡集中策略。通过该策略,源域和目标域的样本能够同时集中,有助于提升表示学习效果。这就像是为两个不同区域的数据找到了一个共同的 “聚集点”,让它们在这个点周围更好地 “交流”,从而提取出更有价值的特征。
- 样本梯度反转策略:鉴于已知异常样本仅存在于目标域这一特点,研究人员引入了样本梯度反转策略。在梯度反向传播过程中,对异常样本的梯度进行特殊处理,使得域判别器无法区分正常样本的域归属,却能准确识别目标域的异常样本。这一策略让域判别器学习到更有效的域判别参数,进而提高了整体的异常检测性能。可以说,这个策略就像是给域判别器戴上了一副特殊的 “眼镜”,让它能更精准地 “看清” 异常样本。
- 半径截断策略:为了防止少数异常值过度分离导致模型过拟合,研究人员设计了半径截断策略。该策略限制了异常样本的分离程度,在避免过拟合的同时,保持了模型平衡的检测能力。好比给异常样本的活动范围设定了一个 “边界”,不让它们 “乱跑”,从而保证模型的稳定性。
- 异常检测规则与特征分布融合:研究人员将异常检测规则与样本特征分布相结合,开发出一种计算样本为正常样本概率的方法。这种方法融入到优化过程中,能够有效利用目标域的未知样本,提高异常检测的准确性。就像是给模型赋予了一种 “预测能力”,让它在面对未知样本时,能更准确地判断其是否正常。
在研究结论与讨论部分,研究人员提出的基于对抗迁移学习的弱监督异常检测模型,成功地将异常检测规则从源域设备迁移到目标设备。尤其是在目标域样本有限且包含已知异常值的情况下,显著提升了异常检测性能。该模型的一系列创新策略,如双域平衡集中策略、样本梯度反转策略等,不仅解决了现有方法存在的问题,还为后续的异常检测研究提供了新的思路和方向。这一研究成果在多个领域都具有广泛的应用前景,有望推动异常检测技术的进一步发展,为各行业的稳定运行和安全保障提供有力支持。