
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度时频特征的打鼾分类
《Scientific Reports》:Snoring classification with deep time-frequency features
【字体: 大 中 小 】 时间:2026年07月03日 来源:Scientific Reports 4.9
编辑推荐:
摘要打鼾是阻塞性睡眠呼吸暂停(OSA)的主要症状,对其准确分类对于无创检测上呼吸道阻塞至关重要。然而,现有方法存在数据不足、类别不平衡以及时间频率信息整合不够的问题。为解决这些难题,本文提出了一种混合集成框架,结合了短时傅里叶变换(STFT)、预训练的卷积神经网络以及L2正则化支
打鼾是阻塞性睡眠呼吸暂停(OSA)的主要症状,对其准确分类对于无创检测上呼吸道阻塞至关重要。然而,现有方法存在数据不足、类别不平衡以及时间频率信息整合不够的问题。为解决这些难题,本文提出了一种混合集成框架,结合了短时傅里叶变换(STFT)、预训练的卷积神经网络以及L2正则化支持向量机(SVM)。首先,利用STFT将打鼾信号转换为具有感知统一性的Viridis颜色映射的频谱图,从而保留重要的时间频率结构。其次,从预训练的AlexNet的fc7层提取深度时间频率特征,这一方法能有效缓解标注数据有限的问题。最后,采用L2正则化SVM替代传统的softmax分类器,以应对高维度、小样本条件下的过拟合问题。在慕尼黑-帕绍打鼾声音语料库上的实验表明,该方法在测试集上的未加权平均召回率为67.1%,优于包括端到端卷积神经网络和基于Transformer的音频模型在内的现有最佳方法。消融实验显示,若去掉短时傅里叶变换、预训练卷积神经网络或支持向量机中的任意一个组件,性能都会下降多达21.3%。所提出的框架为打鼾源定位提供了一种有效、通用且数据效率高的解决方案。