基于多尺度通道窗口注意力机制(MCWA)的通用AI生成图像检测方法UR2EA研究

【字体: 时间:2025年09月08日 来源:Neural Networks 6.3

编辑推荐:

  【编辑推荐】本文提出通用重建残差分析(UR2EA)方法,通过扩散模型重建误差(DDIM/ADM)构建通用先验,结合创新多尺度通道窗口注意力(MCWA)模块,在包含30种生成模型的UniversalForensics数据集上实现AI生成图像(GAN/Diffusion)检测准确率提升3.3%。该研究解决了传统方法在跨模型(GAN与Diffusion)检测中的泛化瓶颈问题。

  

Highlight

• 提出通用生成图像检测方法UR2EA,通过扩散重建误差(DIRE)同时检测GAN生成图像和扩散生成图像

• 设计多尺度通道窗口注意力(MCWA)模块,通过循环移位操作扩展感受野,增强残差图像特征提取能力

• 构建UniversalForensics数据集,包含30种生成模型的合成图像

Related Work

本节概述了扩散模型(DDPM/DDIM)的发展历程,以及基于卷积神经网络(CNN)的通用图像检测器研究现状,包括频域分析(FreDect)和人工特征提取等方法。

UR2EA方法

基于扩散重建误差的通用检测框架:

  1. 1.

    发现GAN生成图像重建质量低于真实图像,而扩散生成图像重建更精确的反常现象

  2. 2.

    采用预训练ADM模型生成残差图作为通用先验

  3. 3.

    MCWA模块通过多尺度窗口注意力(局部-全局)和通道注意力(频域动态调节)的协同机制,在ResNet残差块中实现细粒度特征捕获

The UniversalForensics Dataset

数据集特点:

  • 训练集:8万张ProGAN生成图像(ForenSynths)+4万张扩散生成图像(DiffusionForensics)+12万张真实图像

  • 测试集:30种生成模型(包含StyleGAN、LDM等)的合成图像

  • 支持RGB/频域/残差图三模态输入

Conclusion

本研究重新定义了扩散重建误差(DIRE)的适用场景,通过UR2EA框架在跨模型检测任务中实现8.2%的平均准确率提升。MCWA模块的创新设计为生成图像检测提供了新的特征提取范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号