
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于改进离散余弦变换与Wasserstein生成对抗网络的咳嗽信号增强及分类研究
【字体: 大 中 小 】 时间:2025年06月09日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
为解决咳嗽信号数据不足导致的计算机辅助诊断(CAD)系统准确率低的问题,研究人员采用改进离散余弦变换(MDCT)表征咳嗽信号,结合Wasserstein生成对抗网络(WGAN)进行数据增强,通过卷积神经网络(CNN)分类,最终实现分类准确率提升17%。该研究为呼吸系统疾病诊断提供了高效的数据增强方案。
咳嗽作为呼吸系统疾病的常见症状,其声学特征蕴含重要的临床信息。然而,现有咳嗽数据库规模有限,严重制约了基于深度学习(DL)的计算机辅助诊断(CAD)系统性能。传统数据增强方法如旋转、加噪等会破坏医学信号的原始分布,而生成对抗网络(GAN)虽能生成逼真数据,却面临梯度爆炸和模式坍塌问题。针对这些挑战,一项发表于《Biomedical Signal Processing and Control》的研究提出创新解决方案。
该研究团队采用改进离散余弦变换(MDCT)将咳嗽信号转换为时频图像,利用Wasserstein生成对抗网络(WGAN)进行数据增强,最终通过卷积神经网络(CNN)实现疾病分类。关键技术包括:1) 采用切比雪夫、高斯、锥形余弦和Kaiser-Bessel四种窗函数构建MDCT表征;2) 基于Wasserstein距离优化的GAN架构生成增强数据;3) 使用公开咳嗽数据集验证框架有效性。
系统模型
研究构建了包含MDCT转换、WGAN增强和CNN分类的三阶段框架。MDCT通过50%重叠分块克服传统DCT的块效应,WGAN的生成器-判别器结构通过最小化Wasserstein距离稳定训练过程。
结果与讨论
实验表明:1) Kaiser-Bessel窗构建的MDCT表征最优,分类准确率达89.7%;2) WGAN增强使数据集规模扩大3倍,CNN分类准确率提升17%;3) 时频可视化证实增强数据保留了真实咳嗽信号的相位特征(爆发相、稳态相)。
结论
该研究首次将MDCT-WGAN组合应用于咳嗽信号增强,解决了医学数据稀缺的核心难题。WGAN通过Wasserstein损失函数避免模式坍塌,MDCT的多窗分析为时频表征选择提供新思路。框架的17%准确率提升证实其在哮喘、COPD等呼吸系统疾病诊断中的潜在价值,为医疗AI的小样本学习开辟了新途径。
生物通微信公众号
知名企业招聘