基于混合CNN与MFCC特征提取的新生儿窒息哭声检测方法研究

【字体: 时间:2025年06月16日 来源:Neuroscience Informatics CS11.7

编辑推荐:

  为解决新生儿窒息早期诊断难题,研究人员采用混合CNN和MFCC特征提取技术,结合机器学习(ML)与深度学习(DL)模型,开发了一种高效识别窒息哭声的AI系统。研究在Baby Chillanto数据集上实现LR模型99.16%准确率,ANN1模型98.20%准确率,为临床提供低成本、快速诊断工具,显著降低新生儿死亡率。

  

新生儿窒息是导致全球新生儿死亡和长期残疾的主要原因之一,每年造成约24%的新生儿死亡。传统诊断依赖MRI、CT等昂贵设备,在资源匮乏地区难以普及。而婴儿哭声的声学特征已被证明能反映健康状况,但现有分析方法存在准确率不足、延迟高等问题。为此,来自孟加拉国信息与通信技术部资助的研究团队在《Neuroscience Informatics》发表论文,提出一种结合机器学习与深度学习的混合模型,通过分析哭声实现窒息早期筛查。

研究采用Baby Chillanto数据库的1049例正常和340例窒息哭声样本,关键技术包括:1)Mel频率倒谱系数(MFCC)提取时频域特征;2)随机过采样(ROS)解决数据不平衡;3)构建改进的ANN1、CNN1/CNN2深度学习架构;4)GridSearchCV优化超参数。

研究结果显示:

  1. 模型性能对比:逻辑回归(LR)以99.16%准确率(误差0.008%)成为最优ML模型,ANN1以98.20%准确率(误差0.018%)领跑DL模型。
  2. 特征有效性:MFCC结合波形特征显著提升分类效果,优于传统LPC等方法。
  3. 统计验证:ANN模型组平均准确率97.48%±0.86%,显著高于CNN组(94.17%±1.15%)。

结论部分指出,该研究首次在完整Baby Chillanto数据集上实现近99%的窒息识别率,较前人研究提升2-6个百分点。ANN1模型通过引入隐藏层结构,在保持较低计算复杂度(O(n3
))的同时优化性能。未来计划联合多国医院扩大样本量,进一步验证模型的临床适用性。这项工作为资源受限地区提供了可替代昂贵影像检查的AI诊断方案,对降低全球新生儿死亡率具有重要实践意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号