
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于DiffPIR扩散模型与DenseNet121的深度伪造检测技术研究:提升AI生成内容鉴别的准确性与鲁棒性
【字体: 大 中 小 】 时间:2025年06月20日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对AI生成内容(如Deepfake)的隐蔽性导致传统检测方法失效的问题,研究人员提出结合DiffPIR扩散模型(图像增强)与DenseNet121-CNN的混合架构,通过增强面部特征可见性及高频信息提取,在Celeb-DF等数据集上实现99.91%的检测准确率,为数字安全与媒体真实性验证提供新范式。
在数字技术爆炸式发展的今天,Deepfake技术凭借生成对抗网络(GAN)和扩散模型(Diffusion Model)的进步,已能合成以假乱真的虚假图像与视频。这类技术不仅威胁个人隐私和金融安全(如中国2021年发生的7600万美元税务诈骗案),更可能引发社会信任危机。然而,传统检测方法依赖的细微伪影(如面部边缘失真)正因生成技术的迭代而逐渐消失,现有模型的准确率与泛化能力面临严峻挑战。
天津大学人工智能与海洋信息处理实验室(AIMIP)的Fazeela Siddiqui团队在《Knowledge-Based Systems》发表的研究中,创新性地将DiffPIR扩散模型与DenseNet121卷积神经网络结合,构建了“增强-检测”双阶段框架。该研究通过扩散模型迭代优化图像质量,强化面部高频特征(如纹理与光照异常),再经改进的CNN架构实现分类,最终在Celeb-DF等数据集上突破99.91%的准确率,较现有技术显著提升。
关键技术方法
研究团队首先采用DiffPIR模型对GAN处理的真假视频帧进行增强,利用其傅里叶变换组件分解振幅与相位信息以修复退化区域;随后设计以DenseNet121为核心的CNN分类器,结合最大池化(maxpooling)与Sigmoid函数输出概率,并针对性优化面部区域输入策略。实验数据来自AIMIP自建的500例名人视频库(170真实/330合成)及公共数据集Celeb-DF(590真实/5639虚假)、DFD(363真实/3068虚假)。
研究结果
DiffPIR增强效果验证
扩散模型通过多尺度去噪与边缘重建,使原始图像中难以察觉的GAN生成伪影(如非自然瞳孔反光)显性化,同时保持真实图像的生物特征一致性。定量分析显示,增强后帧的峰值信噪比(PSNR)提升23.6%。
混合架构性能优势
DenseNet121凭借密集连接机制高效提取多层次特征,而DiffPIR的预处理使模型对Celeb-DF中高级换脸技术的检测准确率提高12.4%。消融实验证实,单独使用任一组件时性能均下降至少8.7%。
跨数据集泛化能力
在DFD数据集上,模型对低分辨率伪造视频的检出率达98.2%,显著优于传统XGBoost方法(89.5%),证明其对不同生成源的适应性。
结论与意义
该研究首次将扩散模型的生成能力逆向应用于检测任务,通过“以生成反生成”的思路破解了Deepfake技术进化带来的对抗困境。其核心创新点在于:
未来工作需进一步优化计算效率,并探索Transformer架构与扩散模型的结合,以应对日益复杂的多模态伪造挑战。
生物通微信公众号
知名企业招聘