基于归一化一致性的数据筛选方法:提升深度伪造检测泛化能力的新策略

《Neurocomputing》:Normalization-consistent data curation for generalizable deepfake detection

【字体: 时间:2025年10月18日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出归一化一致性数据筛选(NormCura)方法,通过评估训练样本在不同归一化参数(如μ0/σ0)下的预测稳定性,筛选出对预处理变化不敏感的鲁棒样本进行训练。该方法无需修改模型结构即可显著提升深度伪造检测器在跨数据集(如FF++、DiFF)的泛化性能,尤其对扩散模型生成的人脸具有强适应性,为克服数据偏见依赖提供了新思路。

  
亮点
深度伪造生成技术涵盖全脸合成(Whole Face Synthesis)、属性操控(Attribute Manipulation)、身份替换(Identity Swap)及表情移植(Expression Swap)等方向。全脸合成依赖生成对抗网络(GAN)和扩散模型(Diffusion Models)生成虚拟人脸;属性操控通过调整肤色、发色等局部特征实现面部篡改;身份替换与表情移植则分别针对个体生物特征和动态表情进行迁移。
问题阐述
给定包含N个样本的源数据集D = {(xi, yi)}i=1N,其中xi∈RC×H×W为图像张量,yi∈{0,1}为真假标签,目标是训练检测器fθ: RC×H×W→[0,1]使其适应分布差异显著的未知数据集。
方法概览
如图2所示,NormCura框架包含两个阶段:
阶段I 首先通过预热训练获得初始检测器,随后利用该检测器在多组归一化参数(如μtest=αμ0, σtest=βσ0)下评估训练样本的预测一致性,筛选出稳定性高的样本子集。
阶段II 基于筛选后的鲁棒样本重新训练检测模型,使模型专注于学习对归一化变化不敏感的法医学特征(如篡改边界痕迹),而非数据集特异性伪影。
实验验证
本节通过系统实验评估NormCura效能:首先介绍数据集配置(包括FF++、DF40等9个深度伪造数据集)、模型实现细节与评估指标;随后进行泛化性能测试,涵盖换脸技术与扩散生成数据的跨域检测;进一步分析模型对图像扰动(如压缩、噪声)的鲁棒性;通过消融实验验证核心模块贡献度,并探究一致性阈值敏感性等参数影响。
结论
NormCura通过数据层面优化显著缓解了深度伪造检测中的归一化敏感性问题。该方法以预测一致性为筛选准则,使模型摆脱对预处理参数的依赖,在多种新兴伪造技术(如扩散生成人脸)上展现优越的跨域适应性,为构建鲁棒检测系统提供了新范式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号