《Pattern Recognition》:JoCE: Joint Counterfactual Explanations for Interpretable Time Series Anomaly Detection
编辑推荐:
生成时间序列异常检测的反事实解释框架,通过联合时间-特征掩码和动态优化,在保持时序连贯性的同时最小化输入修改,实现模型无关的可解释性分析。
Woojin Jeong | Geonwoo Shin | Jaewook Lee
首尔国立大学,Gwanak-ro 1号,首尔,08826,韩国
摘要
由于时间序列异常检测(TSAD)模型具有复杂的时间依赖性和多变量特征交互作用,对其进行解释仍然具有挑战性。虽然反事实解释(CE)通过建议最小的输入变化来改变模型预测,从而提供了直观且可操作的透明度,但现有的CE方法主要针对分类任务设计,未能解决时间序列数据的结构特性。一些最近的研究探索了用于TSAD的CE方法,但它们要么忽略了时间序列的关键属性,要么仍然依赖于特定的检测模型。为了弥合这一差距,我们提出了JoCE(Joint Counterfactual Explanation),这是一个与模型无关的框架,用于生成TSAD中的现实反事实解释。JoCE识别出时间和特征维度上的最小且因果相关的区域,生成选择性修复这些区域的同时保持时间一致性。我们将这一过程解释为一个平衡现实性、稀疏性和可操作性的受限动态优化问题。在真实世界的TSAD基准测试上的实验表明,JoCE产生了连贯且合理的反事实解释,为理解模型行为提供了更深入的见解。
引言
在多变量时间序列中进行异常检测是各种现实世界系统中的关键任务,例如工业监控、医疗保健和金融。最近,基于Transformer的模型在时间序列异常检测中表现出强大的性能,因为它们能够捕捉复杂的时间依赖性和特征交互作用[1],[2]。尽管这些模型非常有效,但它们通常作为黑箱运行,使得领域专家难以解释或信任它们的预测。随着基于深度学习的异常检测器越来越多地应用于自动化监控系统,对可解释和可靠解释的需求持续增长。
事后可解释方法对于在不改变其底层架构的情况下解释黑箱模型的行为变得至关重要[3]。在这些方法中,反事实解释(CE)提供了一种特别直观且可操作的方法,通过识别会导致模型预测不同的最小、合理的输入变化[4],[5]。与仅突出输入重要区域的显著性图和Grad-CAM [6]不同,CE通过建议具体的替代实例来回答“如果……会怎样”的问题,从而改变模型的决策。例如,在医疗保健中,归因可能表明心率或氧饱和度的变化,但无法建议如何恢复正常模式;在制造业中,它可能识别出有故障的传感器,但无法指导调整以避免未来的故障。这种区别强调了开发专用反事实框架的重要性,特别是在时间序列异常检测中,生成现实且可操作的解释对于决策支持和干预至关重要[3]。
尽管CE在表格和图像领域已经得到了广泛研究[4],[7],但其应用于时间序列数据(尤其是异常检测)的研究仍然不足。一些最近的研究调查了时间序列分类的CE[8],[9],但这些方法不能直接应用于异常检测。与分类不同,分类的标签存在于实例级别,并且反事实是通过从源类移动到目标类来生成的,而TSAD涉及同一序列中的点级或段级标签。因此,解释必须修复局部异常区域,同时保持正常部分,而这正是面向分类的CE方法所不具备的。
除了标记问题之外,时间序列的结构特性进一步复杂化了反事实的生成。与表格数据不同,时间序列表现出时间连续性、自相关性和光谱特性,所有这些都必须保留以生成现实的反事实。此外,时间序列中的时间依赖特征本质上是相互关联的,早期时间步骤的变化可能会对后续观察产生因果影响[10],[11]。这种时间依赖性使得反事实生成变得更加具有挑战性,因为修改必须同时尊重瞬时相关性和时间上的因果传播。忽略这些特性的简单扰动策略通常会导致不合理或不可解释的结果。
在实践中,现有的时间序列异常CE方法要么无法保持时间属性,要么仍然紧密依赖于特定的检测模型,从而限制了它们的现实性和通用性。例如,AR-Pro [12]提出了反事实解释的一般要求,但没有明确考虑时间结构,而TimeVQVAE-AD [13]生成的反事实本质上与其生成检测模型相关联。
为了解决这些差距,我们引入了JoCE(Joint Counterfactual Explanation),这是一个为时间序列异常检测设计的新反事实解释框架。首先,它通过强制执行时间一致性和光谱保真度来确保时间序列的合理性。通过这种方式,JoCE保留了基本的统计属性,如平稳性和平滑性,同时生成稀疏的、段级扰动,从而产生连贯且可解释的修复。其次,它强调与模型无关的实用性,因为它仅通过异常分数函数进行操作。这种设计使JoCE能够与各种异常检测模型广泛兼容,而无需重新训练或访问内部参数。
本工作的主要贡献如下:
- •
我们提出了JoCE,这是一个用于时间序列异常检测的反事实解释框架,它保留了时间连续性和最小性。
- •
我们在真实世界的时间序列异常检测数据集上验证了JoCE的有效性,证明了其生成现实反事实解释的能力。
- •
我们将反事实生成问题表述为一个受限动态系统,并设计了一个新的损失函数,以平衡多个目标,从而生成合理且可解释的解释。
除了这些贡献之外,JoCE通过双轴掩蔽机制确保了稀疏和可解释的扰动,同时保持了时间结构和统计一致性。此外,其与模型无关的设计只需要访问异常分数,从而可以无缝集成到各种黑盒检测器中。这些属性使JoCE成为时间序列异常检测中实用且原则性的反事实解释框架。
本文的其余部分组织如下。第2节回顾了相关工作,第3节定义了问题。第4节介绍了我们的方法,第5节介绍了实验设置,第6节展示了结果。第7节涵盖了理论方面,第8节总结了未来的研究方向。
时间序列异常检测中的可解释性
基于Transformer的模型在时间序列异常检测中最近表现出了强大的性能。Anomaly Transformer [1]引入了关联差异的概念,利用自注意力机制通过识别时间关联中的偏差来检测异常。在此基础上,DCdetector [2]采用了双重注意力对比学习来增强模型在多变量环境中区分正常和异常模式的能力。更近期的研究
问题表述
多变量时间序列中的异常检测旨在识别与预期系统行为显著偏离的异常时间点或段。设
为了解释为什么特定的时间序列X被检测为异常,我们专注于生成
提出的方法
我们现在描述用于解决定义1中受限反事实目标的方法。JoCE是一个与检测器无关的框架,它使用推断的异常分数通过联合时间-特征掩蔽和扰动来生成反事实,降低异常分数的同时保持与原始输入的接近性。整体架构在图1中进行了总结。接下来我们在第4.1节介绍设计目标和优化框架,然后在
数据集
我们在四个广泛用于时间序列异常检测研究的真实世界数据集上评估了我们的方法[2],[31]。这些数据集包括:(1) SMD1,其中包含来自一家互联网公司的五周数据;(2) SWaT2,来源于一个安全的水处理系统;(3) SMAP3,包括土壤样本
反事实质量的定量比较
我们使用两种不同的异常评分模型(基于GPT-2的模型[34]和DCdetector [2])评估了所提出方法在多个真实世界时间序列异常检测数据集上的性能。包括DCdetector是为了确保与以往的工作[12]进行公平比较。为了评估JoCE的鲁棒性和泛化能力,我们还包括了DCdetector。这两种检测器都生成逐点的异常分数
讨论
由于时间复杂性和高维度,时间序列数据的反事实解释具有挑战性。简单的直接优化往往会产生不稳定或不可解释的解决方案,而无梯度或离散搜索方法可能会产生突然的、碎片化的扰动,违反时间平滑性。为了解决这个问题,JoCE将反事实生成表述为一个连续时间动态系统,从而实现平滑的、时间上连贯且可操作的扰动,以改进
结论
在这项工作中,我们提出了JoCE,这是一个用于时间序列异常检测中的反事实解释的与模型无关的框架,它保留了时间连续性和最小性。JoCE将反事实生成视为一个受限动态系统,并优化了一个损失函数,以平衡多个目标,从而生成合理且可解释的解释。在真实世界的TSAD数据集上的实验表明,JoCE生成了现实且可操作的反事实,帮助领域专家进行解释
CRediT作者贡献声明
Woojin Jeong:撰写 – 审查与编辑,撰写 – 原始草稿,可视化,验证,项目管理,方法论,调查,正式分析,数据整理。Geonwoo Shin:验证,调查。Jaewook Lee:撰写 – 审查与编辑,监督,资源,正式分析。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能会影响本文报告的工作。