
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于声谱图分析的COVID-19干咳诊断可解释深度学习框架研究
【字体: 大 中 小 】 时间:2025年08月05日 来源:Healthcare Analytics CS4.4
编辑推荐:
本研究针对医疗AI模型"黑箱"决策难题,开发了基于卷积神经网络(CNN)的COVID-19干咳声谱图分类框架,创新性结合SmoothGrad、Grad-CAM和LIME等可解释人工智能(XAI)技术,系统解析了卷积滤波器在特征提取中的层级作用。相比MobileNetV2,定制CNN模型展现出更清晰的类特异性激活模式,为呼吸系统疾病的非侵入式诊断提供了兼具高准确性(98.8%)和临床可解释性的解决方案。
在人工智能医疗应用蓬勃发展的今天,深度学习模型特别是卷积神经网络(CNN)虽在医学影像识别中表现出色,却始终面临"黑箱"困境——医生和患者难以理解模型为何做出特定诊断,这在COVID-19等重大传染病筛查中尤为关键。传统核酸检测耗时长、成本高,而CT检查存在辐射暴露风险,促使研究者探索基于咳嗽声的非侵入式诊断方法。然而,现有音频分类模型普遍缺乏可解释性,临床医生无法确认模型是依据病理特征还是无关噪声做出判断,严重制约了AI辅助诊断的临床应用。
针对这一挑战,大西洋理工大学(Atlantic Technological University)Donegal校区的Shagufta Henna团队在《Healthcare Analytics》发表了一项创新研究。研究人员开发了专门针对干咳声谱图分析的轻量化CNN架构,并系统应用多种可解释人工智能(XAI)技术揭示模型决策机制。这项研究首次实现了从滤波器层面解读音频分类网络的内部工作机制,为呼吸系统疾病的AI诊断建立了透明化范式。
研究采用多模态技术路线:首先通过短时傅里叶变换(STFT)将160例COVID-19阳性咳嗽音频转换为128×820像素的梅尔声谱图,经时间拉伸、噪声注入等数据增强获得2760个样本。核心CNN架构包含3个二维卷积层(16/32/64个滤波器)和2个全连接层,采用ReLU激活和20%丢弃率防止过拟合。解释性分析方面,研究创新性地组合应用了特征可视化、SmoothGrad噪声梯度平均、梯度加权类激活映射(Grad-CAM)和局部可解释模型(LIME)四种技术,并与预训练MobileNetV2的Guided Grad-CAM和积分梯度(Integrated Gradients)结果进行对比验证。
【特征可视化揭示层级学习机制】
通过优化算法逆向重构各层滤波器响应模式,研究发现:首层卷积主要捕获基础色彩对比特征;第二层开始出现频率带状的初级结构;第三层则形成明显的类特异性谱线模式。最终全连接层可视化显示,COVID-19病例的判别特征集中分布于声谱图中央区域,呈现紫绿双色特征,而非COVID-19病例的特征则分散且以紫色为主。这种层级递进的特征演化证实了CNN从抽象到具体的病理特征提取过程。
【多维度可解释性分析】
SmoothGrad分析显示,虽然能识别声谱图底部的高贡献区域,但对两类样本的区分度有限。Grad-CAM则精准定位到COVID-19病例的中高频区域(200-400Hz),热图显示该类激活更集中连贯。LIME进一步识别出咳嗽起始段的瞬态特征对COVID-19诊断具有决定性。相比之下,MobileNetV2的解释图呈现碎片化特征,COVID-19预测的激活区域分散且不一致,反映其迁移学习在专业医疗音频中的局限性。
【性能与解释性平衡】
模型比较显示,定制CNN在准确率(98.8%)、F1值(1.0)和AUC(0.99)上全面超越MobileNetV2(F1=0.25)和ResNet-50(F1=0),证明针对特定医疗场景设计的轻量化网络不仅性能更优,其内部特征也更具病理相关性。特别值得注意的是,CNN第三层64号滤波器可视化出与临床已知的COVID-19咳嗽声"高频缺失"特征高度吻合的激活模式,为模型决策提供了生理学依据。
这项研究在方法学和应用层面均具有突破性价值。在技术上,首次系统验证了滤波器可视化、Grad-CAM和LIME等方法在音频分类解释中的协同效应,建立了医疗AI可解释性分析的标准流程。临床应用方面,研究证实基于咳嗽声谱图的CNN模型不仅能实现高精度筛查,其决策过程还可与呼吸道病理特征相对应,极大增强了临床可信度。研究团队特别指出,相比通用视觉模型,定制化架构在医疗专用数据上表现出更优的解释一致性,这一发现对指导医疗AI开发具有普适意义。
未来研究方向包括扩大样本多样性以验证特征泛化性,以及探索基于注意力机制的时序解释方法。该框架可扩展至肺炎、哮喘等呼吸系统疾病的声学筛查,为AI辅助诊断的临床落地树立了新标杆。正如研究者强调的:"在性命攸关的医疗决策中,准确性只是起点,可解释性才是AI真正融入临床实践的关键。"这项研究为破解医疗AI的"黑箱困境"提供了切实可行的技术路线。
生物通微信公众号
知名企业招聘