基于Dempster-Shafer层证据一致性的对抗样本检测与防御

《Knowledge-Based Systems》:Adversarial example detection and defense based on the evidence consistency from Dempster-Shafer layers

【字体: 时间:2025年11月22日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  对抗样本检测与鲁棒分类统一框架:基于Dempster-Shafer证据一致性的CNN防御机制,通过图像变换量化证据冲突实现检测,结合不确定性区域构建增强鲁棒性的分类器,在CIFAR-10和EDRI数据集上验证,BMR指标优于现有方法。

  CNN(卷积神经网络)在图像识别、分类、检测等任务中表现出色,已成为现代人工智能技术的重要基石。然而,其在面对精心构造的对抗样本时却展现出明显的脆弱性。对抗样本通常指的是在原始输入图像上施加极小且难以察觉的扰动后,导致CNN模型产生错误预测的输入。这种现象不仅威胁了模型的安全性,也对依赖CNN进行决策的系统(如医疗影像分析、自动驾驶等)带来了严峻挑战。因此,如何有效检测和防御对抗样本,成为当前深度学习研究中的一个关键课题。

传统方法在应对对抗样本时往往存在局限性。一些方法通过在模型中添加额外的检测模块,试图识别对抗样本,但这类方法依赖于对攻击方式的先验知识或假设,导致其在实际部署中缺乏灵活性。此外,许多检测方法仅关注于对抗样本的分布特性,而未能充分考虑模型内部的不确定性。另一方面,防御方法如梯度掩码和对抗训练虽然在一定程度上提高了模型的鲁棒性,但它们通常需要特定的攻击场景进行调整,且在面对黑盒攻击时效果有限。更严重的是,对抗训练会显著增加计算成本,并可能导致模型在处理正常样本时性能下降。

针对上述问题,本文提出了一种基于证据理论的统一防御框架,即Ead(Evidential Adversarial Defense)。该框架旨在同时实现对抗样本的检测与防御,无需依赖攻击者的先验知识或额外的检测组件。Ead的核心思想是利用证据理论(Dempster-Shafer Theory)来衡量模型对输入样本的不确定性,从而区分正常样本与对抗样本。证据理论提供了一种非概率性的不确定性量化方法,允许模型在面对不确定输入时,生成更可靠的分类结果。本文将这一理论应用于CNN的结构中,构建了一个能够同时检测和防御对抗样本的系统。

在Ead框架中,对抗样本的检测是通过评估证据的一致性来实现的。具体而言,模型对原始图像和经过变换后的图像分别进行分类,并通过证据理论计算这两个分类结果之间的冲突程度。正常样本在图像变换后仍能保持一致的证据分布,而对抗样本则会在变换后表现出较大的冲突。因此,Ead框架能够有效地识别出对抗样本,并在检测的同时提供更具鲁棒性的分类结果。这种设计不仅提升了模型的防御能力,还避免了传统方法中对攻击方式的依赖。

为了进一步增强模型的防御能力,本文还引入了不确定性区域的概念。在对抗样本的扰动被限制在特定范数范围内时,它们通常会集中在决策边界附近,而正常样本则远离这一区域。因此,模型可以通过构建不确定性区域,对处于边界附近的样本进行更细致的分析。这种机制有助于模型在面对轻微扰动时,仍然能够保持较高的分类准确率,同时有效识别出潜在的对抗样本。此外,Ead框架在不依赖额外组件的情况下,能够在白盒和黑盒攻击场景中均表现出较强的防御能力,这使其在实际应用中更具优势。

本文在实验部分对Ead框架进行了全面评估。实验采用CIFAR-10和Eye Disease Retinal Images(EDRI)两个具有代表性的数据集,分别涵盖了自然图像和医学图像。通过引入一种新的评估指标——Bypass Misclassification Rate(BMR),即绕过检测的误分类率,本文能够更准确地衡量模型在检测和防御对抗样本方面的综合性能。BMR指标的引入不仅为评估对抗样本的检测效果提供了新的视角,还能够量化模型在实际部署中可能面临的误判风险。实验结果表明,Ead框架在多个攻击类型下均表现出色,其检测率和防御效果均优于现有方法。

在具体实现上,Ead框架的核心在于其对证据的处理方式。模型首先对输入图像进行分类,并通过Dempster-Shafer理论生成对应的质量函数(mass function)。随后,模型对变换后的图像进行相同的分类过程,并计算质量函数之间的冲突程度。冲突程度的计算基于Dempster-Shafer理论中的组合规则,能够有效反映模型对输入样本的不确定性。如果冲突程度较高,则表明该样本可能为对抗样本。通过这种方式,Ead框架能够在不依赖额外检测组件的前提下,实现对抗样本的自动识别。

此外,Ead框架还通过不确定性区域的构建,提高了模型的分类鲁棒性。在传统CNN中,决策边界通常较为狭窄,导致模型对微小扰动非常敏感。而Ead框架通过引入不确定性区域,能够对处于边界附近的样本进行更细致的分类。这种机制不仅有助于提升模型的分类性能,还能够有效缓解对抗样本带来的影响。在实际应用中,这种不确定性区域的构建方式能够帮助模型在面对未知攻击时,仍然保持较高的识别准确率。

本文的另一个重要贡献是其对证据理论在对抗样本检测中的应用进行了深入探讨。虽然证据理论在不确定性量化方面已有一定研究,但将其应用于对抗样本检测仍然是一个较为新颖的思路。通过将证据理论与CNN相结合,Ead框架不仅能够检测对抗样本,还能够在分类过程中提供更可靠的决策依据。这种融合方式使得模型在面对不确定输入时,能够更合理地分配置信度,从而提升其整体的鲁棒性。

Ead框架的设计具有高度的灵活性和适应性。它不依赖于特定的攻击类型或攻击场景,能够在多种情况下有效运行。这种特性使其在实际部署中更具优势,尤其是在面对未知攻击时。此外,Ead框架能够在模型推理过程中自动完成检测和防御任务,无需额外的组件或参数调整,这大大简化了其应用流程。实验结果表明,Ead框架在处理不同类型的对抗样本时,均能保持较高的检测率和分类准确率,证明了其在实际应用中的有效性。

在实验部分,本文对Ead框架进行了全面测试,并与其他先进的防御方法进行了对比。测试结果表明,Ead框架在检测对抗样本时表现出色,其检测率显著高于传统方法。同时,在分类任务中,Ead框架也能够保持较高的准确率,表明其在防御和检测之间实现了良好的平衡。此外,实验还验证了Ead框架在白盒和黑盒攻击场景下的鲁棒性,证明了其在不同攻击条件下的适应能力。

综上所述,本文提出的Ead框架为对抗样本的检测与防御提供了一种新的思路。该框架结合了证据理论与CNN的优势,能够在不依赖攻击者先验知识或额外组件的情况下,实现高效的对抗样本检测和分类。其在多个数据集和攻击类型上的实验结果表明,Ead框架具有较强的通用性和实用性,能够为深度学习模型的安全性提供有力保障。未来的研究可以进一步探索Ead框架在其他任务中的应用,如目标检测、语义分割等,以提升模型在更广泛场景下的鲁棒性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号