突破数据稀缺瓶颈:基于Rectified Flow扩散模型的鼾声增强与分类新方法

《Biomedical and Environmental Sciences》:Breaking through data scarcity: A novel diffusion model approach for snoring sound augmentation and classification

【字体: 时间:2026年01月09日 来源:Biomedical and Environmental Sciences 4.1

编辑推荐:

  本综述针对阻塞性睡眠呼吸暂停(OSA)诊断中鼾声数据稀缺与类别不均衡的核心挑战,创新性地提出了一种基于Rectified Flow的端到端一维信号扩散模型(RFSSDiff)。该方法通过直接合成原始波形进行数据增强,并结合单数据扩散模型(SingleDDM)重点提升稀有类别样本的生成质量,在慕尼黑-帕绍鼾声音频库(MPSSC)上实现了自动鼾声分类(ASSC)特异性、敏感性和准确率的显著提升,为医疗数据稀缺条件下的睡眠障碍辅助诊断提供了新思路。

  
亮点
  • 我们提出了一种端到端的鼾声音频生成框架,可直接合成原始波形片段,以增强MPSSC数据集上的下游自动鼾声分类(ASSC)任务,相较于传统的基于二维梅尔频谱图的生成方法,展现了卓越的保真度和分类性能。
  • 我们引入了基于Rectified Flow的扩散机制,从几何上拉直了扩散采样路径,使模型能够更精确地捕捉与类别相关的声学特征,从而提高了生成鼾声的真实性和可区分性。
  • 我们针对不均衡数据集提出了一种按类别进行的数据增强策略,利用单数据扩散(SingleDDM)为每个类别(尤其是少数类)独立生成合成样本,并在所提出的框架下实现了更稳健、均衡的ASSC性能。使用合成数据训练的分类器性能比基线提高了5.8%。
音频分析与生成
近年来,随着计算机视觉(CV)生成技术的飞速发展,音频生成也蓬勃兴起,因为音频片段可以以二维频谱图的形式呈现。开创性的模型经过调整可以处理不同的问题,例如视频生成、多模态任务或三维视觉生成。生成对抗网络(GAN)和扩散模型是两种主要的底层模型。GAN包含一个生成器和一个判别器,它们以对抗方式进行训练,使生成器能够产生更...
端到端采样扩散过程
这项工作的基础是去噪扩散概率模型(DDPM)。前向过程q(·)通过根据方差调度βt逐步添加噪声ε ~ N(0, I),将数据样本x0映射到各向同性高斯噪声,并且噪声状态xt可以通过闭式采样得到:xt= √(αt) x0+ √(1 - αt) ε,其中αt= 1 - βt, αt= ∏ti=1αi
反向过程pθ(·)学习逆转这种变换,从纯高斯噪声p(xT) ~ N(0, I)开始,向干净样本x0进行,其目标函数为:LD(θ) = Ex0, ε, t‖ε - εθ(√(αt) x0+ √(1 - αt) ε, t, c)‖22,其中εθ是...
数据集
慕尼黑-帕绍鼾声音频库(MPSSC)数据库最初是为了收集由上气道不同部位激发的鼾声并进行进一步的医学研究而建立的。该数据库包含来自219名受试者的828个鼾声事件,并已被划分为训练集(282个片段)、开发集(283个片段)和测试集(263个片段)。音频片段由经验丰富的医生根据其起源区域分为4类:V(软腭)、O(口咽侧壁)、T(舌根)和E(会厌)。音频...
局限性与未来工作
在这项工作中,我们达到了62.5%的未加权平均召回率(UAR),比基准56.7%提高了5.8%,但这仍有改进空间。作为比较,先前关于MPSSC数据集的研究报告了使用基于小波特征的69.4% UAR,使用二元模式描述符的72.6% UAR,以及使用深度散射特征结合深度神经网络(DNN)分类器的67.7% UAR。然而,有一个关键因素可能影响结果。T类(舌根)的数量太少,因此,T类的准确性...
结论
为了解决自动鼾声分类(ASSC)数据有限的问题,本文提出了一种利用基于Rectified Flow的端到端扩散模型的尖端数据增强技术。通过在MPSSC数据上进行大量实验,我们发现基于Rectified Flow扩散的数据增强,结合按类别分离的训练策略和高比例稀疏类数据生成,能够产生具有强大类别特征和高...的新标记数据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号