基于深度时频特征的打鼾分类

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

基于深度时频特征的打鼾分类

《Scientific Reports》：Snoring classification with deep time-frequency features

【字体：大中小】 时间：2026年07月03日 来源：Scientific Reports 4.9

编辑推荐：

　　摘要打鼾是阻塞性睡眠呼吸暂停（OSA）的主要症状，对其准确分类对于无创检测上呼吸道阻塞至关重要。然而，现有方法存在数据不足、类别不平衡以及时间频率信息整合不够的问题。为解决这些难题，本文提出了一种混合集成框架，结合了短时傅里叶变换（STFT）、预训练的卷积神经网络以及L2正则化支

摘要

打鼾是阻塞性睡眠呼吸暂停（OSA）的主要症状，对其准确分类对于无创检测上呼吸道阻塞至关重要。然而，现有方法存在数据不足、类别不平衡以及时间频率信息整合不够的问题。为解决这些难题，本文提出了一种混合集成框架，结合了短时傅里叶变换（STFT）、预训练的卷积神经网络以及L2正则化支持向量机（SVM）。首先，利用STFT将打鼾信号转换为具有感知统一性的Viridis颜色映射的频谱图，从而保留重要的时间频率结构。其次，从预训练的AlexNet的fc7层提取深度时间频率特征，这一方法能有效缓解标注数据有限的问题。最后，采用L2正则化SVM替代传统的softmax分类器，以应对高维度、小样本条件下的过拟合问题。在慕尼黑-帕绍打鼾声音语料库上的实验表明，该方法在测试集上的未加权平均召回率为67.1%，优于包括端到端卷积神经网络和基于Transformer的音频模型在内的现有最佳方法。消融实验显示，若去掉短时傅里叶变换、预训练卷积神经网络或支持向量机中的任意一个组件，性能都会下降多达21.3%。所提出的框架为打鼾源定位提供了一种有效、通用且数据效率高的解决方案。

联系信箱：

粤ICP备09063491号

摘要

热点排行