基于单步引导扩散模型的高效对抗净化方法研究

【字体: 时间:2025年07月20日 来源:Neural Networks 6.0

编辑推荐:

  为解决扩散模型在对抗净化中多步采样导致的效率瓶颈,研究人员提出单步引导扩散模型(OSGD)。该方法通过两轮单步去噪结合引导策略,在PGD/AutoAttack/BPDA+EOT等攻击下实现69.68%的鲁棒准确率,Cifar10数据集净化速度较GDMP提升60倍,为医疗影像等安全敏感领域提供高效防御方案。

  

在人工智能技术广泛应用于医疗诊断和自动驾驶的今天,深度学习模型面临的对抗攻击问题日益严峻。研究表明,即使是最先进的图像识别系统,也会因输入图像中人为添加的细微扰动(adversarial perturbations)而出现严重误判。这种安全隐患在医疗影像分析等关键领域可能造成灾难性后果。传统防御方法如对抗训练(adversarial training)存在泛化性差、计算成本高等缺陷,而基于扩散模型(Denoising Diffusion Probabilistic Model, DDPM)的对抗净化技术虽效果显著,却受限于多步反向生成过程导致的效率瓶颈——例如处理Cifar10万级图像需耗时5小时,严重制约其临床应用。

针对这一挑战,中国的研究团队创新性地提出单步引导扩散模型(One-Step Guided Diffusion Model, OSGD)。该方法突破性地将传统扩散模型数百步的采样过程压缩为两次单步去噪:首轮生成初步去噪图像作为引导信号,次轮在引导下完成对抗噪声的精准去除。这种"两步走"策略不仅将Cifar10数据集净化时间缩短至5分钟,在4×4090 GPU配置下即可完成ImageNet 5000张图像的实时处理,更在PGD+EOT攻击下创下69.68%的鲁棒准确率新纪录。相关成果发表于《Neural Networks》,为安全关键领域的模型防御提供了兼具高效性与可靠性的解决方案。

关键技术包括:1)基于DDPM的双轮单步去噪框架;2)初步去噪图像引导机制;3)对抗样本与正常样本KL散度分析;4)在Cifar10/ImageNet数据集上采用PGD/AutoAttack/BPDA+EOT三类攻击模式的验证体系。

【Methodology】
研究团队首先理论证明:当对抗样本与正常样本经前向扩散后KL散度达到极小值时,单步去噪即可有效消除扰动。OSGD首轮通过参数估计获得初步净化图像Xpre,次轮以Xpre为引导信号,通过条件分布pθ(xt-1|xt,Xpre)完成最终净化。

【Experiments】
在Cifar10测试中:1)速度方面,OSGD较GDMP提速60倍;2)资源消耗仅需GDMP的1/2 GPU配置;3)防御性能上,对BPDA+EOT攻击的鲁棒准确率达69.68%,超出基线方法13个百分点。ImageNet实验进一步验证其跨数据集适用性。

该研究开创性地将扩散模型净化效率提升至毫秒级,其引导机制为生成式防御提供了新范式。特别是在医疗影像等对实时性要求严格的场景,OSGD的"即插即用"特性展现出显著优势。团队指出,未来可探索多模态引导策略以进一步提升复杂攻击下的语义保持能力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号