
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多尺度通道窗口注意力机制(MCWA)的通用AI生成图像检测方法UR2EA研究
【字体: 大 中 小 】 时间:2025年09月08日 来源:Neural Networks 6.3
编辑推荐:
【编辑推荐】本文提出通用重建残差分析(UR2EA)方法,通过扩散模型重建误差(DDIM/ADM)构建通用先验,结合创新多尺度通道窗口注意力(MCWA)模块,在包含30种生成模型的UniversalForensics数据集上实现AI生成图像(GAN/Diffusion)检测准确率提升3.3%。该研究解决了传统方法在跨模型(GAN与Diffusion)检测中的泛化瓶颈问题。
Highlight
• 提出通用生成图像检测方法UR2EA,通过扩散重建误差(DIRE)同时检测GAN生成图像和扩散生成图像
• 设计多尺度通道窗口注意力(MCWA)模块,通过循环移位操作扩展感受野,增强残差图像特征提取能力
• 构建UniversalForensics数据集,包含30种生成模型的合成图像
Related Work
本节概述了扩散模型(DDPM/DDIM)的发展历程,以及基于卷积神经网络(CNN)的通用图像检测器研究现状,包括频域分析(FreDect)和人工特征提取等方法。
UR2EA方法
基于扩散重建误差的通用检测框架:
发现GAN生成图像重建质量低于真实图像,而扩散生成图像重建更精确的反常现象
采用预训练ADM模型生成残差图作为通用先验
MCWA模块通过多尺度窗口注意力(局部-全局)和通道注意力(频域动态调节)的协同机制,在ResNet残差块中实现细粒度特征捕获
The UniversalForensics Dataset
数据集特点:
训练集:8万张ProGAN生成图像(ForenSynths)+4万张扩散生成图像(DiffusionForensics)+12万张真实图像
测试集:30种生成模型(包含StyleGAN、LDM等)的合成图像
支持RGB/频域/残差图三模态输入
Conclusion
本研究重新定义了扩散重建误差(DIRE)的适用场景,通过UR2EA框架在跨模型检测任务中实现8.2%的平均准确率提升。MCWA模块的创新设计为生成图像检测提供了新的特征提取范式。
生物通微信公众号
知名企业招聘