基于咳嗽信号相空间重构与三维深度卷积神经网络的COVID-19精准检测新方法
《Scientific Reports》:Advanced COVID-19 detection using cough signals with space reconstruction and 3D deep convolutional neural networks
【字体:
大
中
小
】
时间:2025年11月25日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对传统COVID-19检测方法存在侵入性、设备依赖性强等局限,开发了一种结合相空间重构(PSR)特征工程与三维深度卷积神经网络(3D DCNN)的新型咳嗽音频分析系统。研究人员通过PSR技术将一维咳嗽信号转换为多维特征空间,再编码为3D张量输入定制化网络架构,在COUGHVID数据集上实现了98.5%的准确率、96.5%召回率和99.7%特异性,为无创、快速的疫情筛查提供了创新解决方案。
当COVID-19疫情席卷全球,传统检测方法面临严峻挑战。基于胸部X光或CT的影像学诊断虽能提供重要依据,但需要专业设备、辐射暴露和专业人员操作的限制,难以满足大规模快速筛查的需求。与此同时,研究表明新冠病毒感染会导致呼吸道生理特性改变,进而引起咳嗽声学特征的变化——这为开发新型诊断工具提供了独特契机。
在此背景下,Aymen A. Altae、Abdolvahab Ehsani Rad和Keyvan Mohebbi团队在《Scientific Reports》发表了一项创新研究,将非线性动力系统理论与深度学习技术相结合,开创了咳嗽音频分析的新范式。研究人员意识到,传统声学特征如梅尔频率倒谱系数(MFCC)可能无法充分捕捉COVID-19咳嗽的复杂动态特性,而相空间重构(Phase Space Reconstruction, PSR)这一源自物理学的技术,能够将一维时间序列映射到高维空间,揭示信号背后的动力学“指纹”。
研究团队采用的技术路线包含两个核心环节:特征工程与深度学习架构设计。在特征工程阶段,他们运用PSR将原始咳嗽音频转换为多维相空间表示,关键参数时间延迟τ=13通过互信息(Mutual Information)准则确定,嵌入维度d=5经实验验证为最优。随后通过主成分分析(PCA)降维并离散化为256×256×256的3D张量。在网络设计方面,专门开发了包含五层三维卷积的深度网络(3D DCNN),采用3×3×3卷积核和逐步增加的滤波器数量(64-128-256-512),最终通过softmax层实现三类分类(COVID-19阳性、有症状非COVID、健康)。
数据准备与预处理
研究采用COUGHVID这一大规模众包数据集,包含超过20,000个咳嗽录音。通过质量控制筛选(咳嗽概率得分≥0.5),最终保留8,407个高质量样本,包括6,466例健康个体、658例COVID-19阳性者和1,283例有症状但COVID阴性者。数据集的多样性为模型泛化能力提供了基础。
相空间重构优化
通过系统比较不同嵌入维度(d=3-8)的性能表现,发现d=5时模型达到最优性能(98.5%准确率)。研究还观察到,COVID-19阳性样本的PSR呈现分散、复杂的吸引子几何形态,与健康咳嗽的规则模式形成鲜明对比,这为分类提供了关键区分特征。
模型性能评估
采用5折交叉验证的严格评估显示,PSR+3D DCNN组合在多项指标上显著优于基线方法:准确率98.5%(±0.3%),精确度96.8%,召回率96.5%,特异性99.7%,F1分数96.7%。消融实验进一步证实了PSR的关键贡献——仅使用MFCC的2D CNN准确率为90.2%,STFT谱图的3D DCNN为94.7%,而PSR方法将性能提升了近4个百分点。
对比分析
与现有技术相比,该方法在保持高特异性的同时显著提升了召回率,表明其既能有效识别阳性病例又能最小化误诊风险。例如,相比bispectral方法92.9%的准确率,本方法在保持高精度的同时将召回率从92.8%提升至96.5%。
研究结论表明,PSR与3D DCNN的协同作用能够有效捕捉COVID-19咳嗽的非线性动力学特征。PSR将咳嗽信号映射为几何表征,而3D卷积网络则能学习其中的空间层次特征。这种物理启发式特征工程与深度学习的结合,为呼吸音分析提供了新思路。
讨论部分指出,这种无创、低成本的方法特别适合大规模筛查场景,有望缓解医疗资源压力。然而,研究也承认了众包数据标签噪声、模型计算复杂度高以及可解释性不足等局限。未来工作将聚焦于临床验证、模型轻量化以及可解释人工智能(XAI)技术的集成。
这项研究的创新性在于将动力系统理论中的相空间重构概念引入咳嗽分析领域,通过三维张量表示和空间特征学习,实现了对病理咳嗽动态特性的精细刻画。这不仅为COVID-19诊断提供了新工具,也为其他呼吸系统疾病的音频诊断研究开辟了新途径。随着移动健康技术的发展,这种基于普通录音设备的筛查方案具有广阔的转化应用前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号