基于DiffPIR扩散模型与DenseNet121的深度伪造检测技术研究：提升AI生成内容鉴别的准确性与鲁棒性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月20日 来源：Knowledge-Based Systems 7.2

编辑推荐：

　　针对AI生成内容（如Deepfake）的隐蔽性导致传统检测方法失效的问题，研究人员提出结合DiffPIR扩散模型（图像增强）与DenseNet121-CNN的混合架构，通过增强面部特征可见性及高频信息提取，在Celeb-DF等数据集上实现99.91%的检测准确率，为数字安全与媒体真实性验证提供新范式。

在数字技术爆炸式发展的今天，Deepfake技术凭借生成对抗网络（GAN）和扩散模型（Diffusion Model）的进步，已能合成以假乱真的虚假图像与视频。这类技术不仅威胁个人隐私和金融安全（如中国2021年发生的7600万美元税务诈骗案），更可能引发社会信任危机。然而，传统检测方法依赖的细微伪影（如面部边缘失真）正因生成技术的迭代而逐渐消失，现有模型的准确率与泛化能力面临严峻挑战。

天津大学人工智能与海洋信息处理实验室（AIMIP）的Fazeela Siddiqui团队在《Knowledge-Based Systems》发表的研究中，创新性地将DiffPIR扩散模型与DenseNet121卷积神经网络结合，构建了“增强-检测”双阶段框架。该研究通过扩散模型迭代优化图像质量，强化面部高频特征（如纹理与光照异常），再经改进的CNN架构实现分类，最终在Celeb-DF等数据集上突破99.91%的准确率，较现有技术显著提升。

关键技术方法
研究团队首先采用DiffPIR模型对GAN处理的真假视频帧进行增强，利用其傅里叶变换组件分解振幅与相位信息以修复退化区域；随后设计以DenseNet121为核心的CNN分类器，结合最大池化（maxpooling）与Sigmoid函数输出概率，并针对性优化面部区域输入策略。实验数据来自AIMIP自建的500例名人视频库（170真实/330合成）及公共数据集Celeb-DF（590真实/5639虚假）、DFD（363真实/3068虚假）。

研究结果

DiffPIR增强效果验证
扩散模型通过多尺度去噪与边缘重建，使原始图像中难以察觉的GAN生成伪影（如非自然瞳孔反光）显性化，同时保持真实图像的生物特征一致性。定量分析显示，增强后帧的峰值信噪比（PSNR）提升23.6%。
混合架构性能优势
DenseNet121凭借密集连接机制高效提取多层次特征，而DiffPIR的预处理使模型对Celeb-DF中高级换脸技术的检测准确率提高12.4%。消融实验证实，单独使用任一组件时性能均下降至少8.7%。
跨数据集泛化能力
在DFD数据集上，模型对低分辨率伪造视频的检出率达98.2%，显著优于传统XGBoost方法（89.5%），证明其对不同生成源的适应性。

结论与意义
该研究首次将扩散模型的生成能力逆向应用于检测任务，通过“以生成反生成”的思路破解了Deepfake技术进化带来的对抗困境。其核心创新点在于：

技术融合：DiffPIR作为生成先验（generative prior）提升了图像恢复的物理可解释性，克服了传统高斯去噪器的局限性；
临床价值：为金融身份认证、司法取证等场景提供了可部署的高精度解决方案；
方法论启示：证明了生成模型与判别模型协同优化的可行性，为AI安全领域开辟新路径。

未来工作需进一步优化计算效率，并探索Transformer架构与扩散模型的结合，以应对日益复杂的多模态伪造挑战。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号