一种用于深度伪造音频检测的多层次、迭代式特征工程框架

《Expert Systems with Applications》:A multi-level and iterative feature engineering framework for deepfake audio detection

【字体: 时间:2025年12月12日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文提出FakeSleuthNeXt框架,结合7级离散小波变换提取多尺度特征,采用直方图驱动二元模式与15种统计描述增强可解释性,通过迭代集成特征选择策略优化特征集,实现高精度(89.20%-99.21%)和低等错误率(0.97%-10.85%)的深度伪造音频检测,适用于资源受限的司法和安防场景。

  
本文提出FakeSleuthNeXt框架,旨在解决当前深伪音频检测中存在的三个关键问题:传统方法依赖复杂模型导致资源消耗高、现有特征工程方法缺乏系统性整合、特征选择策略单一。该框架创新性地将多级小波变换与统计特征分析相结合,并采用迭代集成特征选择策略,实现了检测精度与计算效率的平衡。

在技术路径上,研究团队首先采用7级离散小波变换(MDWT)对原始音频信号进行分解。不同于常规的单一频带分析,这种多层次分解能同时捕捉低频段的基础语音模式和高频段细节特征。特别值得关注的是,研究团队开发的FakeSleuthNeXt特征提取器在每个子频带内构建了独特的二元模式描述器,通过对比相邻27帧信号的极值变化路径,生成具有时空关联性的特征向量。这种设计既保留了传统MFCC等时频特征的优势,又通过路径追踪机制捕捉更深层次的声学异常。

在特征优化阶段,研究团队突破了传统单一筛选方法的局限,构建了三级迭代集成系统。首先采用改进的互信息分析(INCA)识别关键特征,接着通过卡方检验(IChi2)过滤冗余指标,最后用改进的ReliefF算法(IReliefF)验证特征稳定性。值得注意的是,这种组合策略经过五轮迭代优化后,特征维数从初始的105个压缩到18个,同时保持98.5%以上的分类准确率。这种特征选择机制不仅减少了计算负担,更通过多维度验证确保了特征的有效性。

实验验证部分展示了该框架的卓越性能。在包含ASVspoof2019、ASVspoof2021等六个数据集的测试中,FakeSleuthNeXt展现出强大的泛化能力:面对72,000个音频片段的复杂测试,系统在99.21%的准确率下仍保持0.97%的最低误识率。特别在ASVspoof2021的噪声干扰测试中,其最小检测混淆度(min-tDCF)达到0.124,较传统方法提升约40%。这些结果在六个不同数据集上均优于现有深度学习模型,同时在保持完全可解释性的前提下,将计算资源消耗降低至GPU的1/10。

创新性体现在三个层面:其一,构建了多维特征空间,通过7级小波分解形成42个频段特征,配合15种统计描述符,形成超过600个维度的原始特征集;其二,开发出基于迭代多数投票(IMV)的特征融合算法,在保证特征多样性的同时实现最优组合;其三,采用分阶段训练策略,使KNN和Cubic SVM等浅层模型在复杂特征空间中仍能保持高精度。这种设计理念突破了传统特征工程对固定参数的依赖,实现了动态特征优化。

应用价值方面,该框架在多个场景中展现出独特优势。在移动端部署测试中,其特征提取阶段仅需0.8秒/音频,特征选择阶段0.3秒/音频,整体处理速度比主流深度学习模型快5倍以上。在司法取证场景的模拟测试中, FakeSleuthNeXt成功识别出99.3%的合成语音,且所有决策过程均可追溯至具体声学参数,解决了传统黑箱模型在证据链构建中的痛点。此外,其可解释性特征使系统特别适用于需要法律证据支持的场景,例如金融欺诈审计或政治言论真实性核查。

当前局限性主要表现在极端噪声环境下的鲁棒性,以及多语言混合场景的适应性。针对前者,研究团队提出分频段特征增强策略,通过调整不同频段的权重系数,使系统在SNR低于8dB时仍能保持85%以上的检测准确率。对于多语言场景,后续工作计划引入语言特征编码模块,通过跨语言声学参数比对提升泛化能力。

该研究对后续工作具有重要启示:首先,验证了传统声学特征在对抗生成模型面前的有效性,证明深度学习并非唯一选择;其次,揭示了特征选择策略对模型性能的关键影响,为特征工程提供新思路;最后,建立了轻量化检测框架的基准,推动资源受限场景下的AI技术应用。后续研究可考虑结合小波包变换提升频谱分辨率,或引入自适应特征选择机制应对动态变化的环境干扰。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号