基于混合CNN与MFCC特征提取的新生儿窒息哭声检测方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月16日 来源：Neuroscience Informatics CS11.7

编辑推荐：

　　为解决新生儿窒息早期诊断难题，研究人员采用混合CNN和MFCC特征提取技术，结合机器学习（ML）与深度学习（DL）模型，开发了一种高效识别窒息哭声的AI系统。研究在Baby Chillanto数据集上实现LR模型99.16%准确率，ANN1模型98.20%准确率，为临床提供低成本、快速诊断工具，显著降低新生儿死亡率。

新生儿窒息是导致全球新生儿死亡和长期残疾的主要原因之一，每年造成约24%的新生儿死亡。传统诊断依赖MRI、CT等昂贵设备，在资源匮乏地区难以普及。而婴儿哭声的声学特征已被证明能反映健康状况，但现有分析方法存在准确率不足、延迟高等问题。为此，来自孟加拉国信息与通信技术部资助的研究团队在《Neuroscience Informatics》发表论文，提出一种结合机器学习与深度学习的混合模型，通过分析哭声实现窒息早期筛查。

研究采用Baby Chillanto数据库的1049例正常和340例窒息哭声样本，关键技术包括：1）Mel频率倒谱系数(MFCC)提取时频域特征；2）随机过采样(ROS)解决数据不平衡；3）构建改进的ANN1、CNN1/CNN2深度学习架构；4）GridSearchCV优化超参数。

研究结果显示：

模型性能对比：逻辑回归(LR)以99.16%准确率(误差0.008%)成为最优ML模型，ANN1以98.20%准确率(误差0.018%)领跑DL模型。
特征有效性：MFCC结合波形特征显著提升分类效果，优于传统LPC等方法。
统计验证：ANN模型组平均准确率97.48%±0.86%，显著高于CNN组(94.17%±1.15%)。

结论部分指出，该研究首次在完整Baby Chillanto数据集上实现近99%的窒息识别率，较前人研究提升2-6个百分点。ANN1模型通过引入隐藏层结构，在保持较低计算复杂度(O(n³
))的同时优化性能。未来计划联合多国医院扩大样本量，进一步验证模型的临床适用性。这项工作为资源受限地区提供了可替代昂贵影像检查的AI诊断方案，对降低全球新生儿死亡率具有重要实践意义。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号