
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于混合CNN与MFCC特征提取的新生儿窒息哭声检测方法研究
【字体: 大 中 小 】 时间:2025年06月16日 来源:Neuroscience Informatics CS11.7
编辑推荐:
为解决新生儿窒息早期诊断难题,研究人员采用混合CNN和MFCC特征提取技术,结合机器学习(ML)与深度学习(DL)模型,开发了一种高效识别窒息哭声的AI系统。研究在Baby Chillanto数据集上实现LR模型99.16%准确率,ANN1模型98.20%准确率,为临床提供低成本、快速诊断工具,显著降低新生儿死亡率。
新生儿窒息是导致全球新生儿死亡和长期残疾的主要原因之一,每年造成约24%的新生儿死亡。传统诊断依赖MRI、CT等昂贵设备,在资源匮乏地区难以普及。而婴儿哭声的声学特征已被证明能反映健康状况,但现有分析方法存在准确率不足、延迟高等问题。为此,来自孟加拉国信息与通信技术部资助的研究团队在《Neuroscience Informatics》发表论文,提出一种结合机器学习与深度学习的混合模型,通过分析哭声实现窒息早期筛查。
研究采用Baby Chillanto数据库的1049例正常和340例窒息哭声样本,关键技术包括:1)Mel频率倒谱系数(MFCC)提取时频域特征;2)随机过采样(ROS)解决数据不平衡;3)构建改进的ANN1、CNN1/CNN2深度学习架构;4)GridSearchCV优化超参数。
研究结果显示:
结论部分指出,该研究首次在完整Baby Chillanto数据集上实现近99%的窒息识别率,较前人研究提升2-6个百分点。ANN1模型通过引入隐藏层结构,在保持较低计算复杂度(O(n3
))的同时优化性能。未来计划联合多国医院扩大样本量,进一步验证模型的临床适用性。这项工作为资源受限地区提供了可替代昂贵影像检查的AI诊断方案,对降低全球新生儿死亡率具有重要实践意义。
生物通微信公众号
知名企业招聘