具有可解释性的深度学习:提升心电图(ECG)和动态心电图(MCG)分析的诊断准确性和可解释性
《Biomedical Signal Processing and Control》:Deep learning with explainability: Improving diagnostic accuracy and interpretability in ECG and MCG analysis
【字体:
大
中
小
】
时间:2025年10月23日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
心血管疾病诊断中提出时空交叉注意力框架,结合可解释的Grad-CAM++方法,显著提升心电图和磁心电图的心肌缺血检测准确率(F1=0.915)和临床可解释性。
心血管疾病(CVDs)仍是全球死亡的主要原因之一,每年导致约1790万人死亡,对全球医疗系统造成巨大负担。因此,早期和准确地检测心脏异常对于及时干预和改善患者预后至关重要。目前,心电图(ECG)是用于评估心脏电信号的最常用非侵入性诊断工具,然而其仍然面临诸多挑战。ECG的解读通常需要专业人员进行复杂的手动分析,近三分之一的病例被报告为误诊或诊断延迟。尽管深度学习技术在自动ECG解读方面取得了一定进展,但其“黑箱”特性限制了在临床环境中的应用。为了解决这一问题,可解释性人工智能(XAI)提供了一种有前景的解决方案,通过揭示模型决策背后的电生理特征,提高透明度和临床信任度。
本研究提出了一种时空交叉注意力框架,结合了优化的多尺度组注意力(MSGA)模块,用于多通道信号分析。该框架融合了传统坐标注意力、多尺度注意力和通道注意力,实现了对多通道电信号的高效处理。为了进一步提升模型的可解释性,我们采用了梯度加权类激活映射(Grad-CAM++)技术,用于可视化并识别异常电生理模式。这一方法不仅增强了模型的透明度,也为临床医生提供了更直观的决策依据。此外,我们将该框架扩展至基于磁卡图(MCG)的心肌缺血诊断,取得了0.915的F1分数,表明该方法在临床诊断中的强大潜力。
MCG作为一种非侵入性、高灵敏度的诊断手段,记录心脏电信号产生的磁场,具有优于ECG的几个优势。例如,MCG的测量结果较少受到身体导电性变化、电极位置或组织干扰的影响,因此可以提供更稳定和准确的信号采集。此外,MCG对电流环路和涡旋模式的高灵敏度,使其在心肌缺血和其它电生理异常的早期检测中展现出独特的优势。近年来,光学泵浦磁力计(OPMs)和无交换弛豫自由(SERF)技术的发展进一步提升了多通道MCG系统的空间分辨率和可行性,使其在临床中的应用前景更加广阔。然而,MCG在临床应用方面仍处于初级阶段,其诊断标准尚未统一,缺乏标准化的波形分析方法,这给临床解读和广泛应用带来了挑战。
随着机器学习(ML)和深度学习(DL)技术的快速发展,这些方法在心脏信号的自动分析方面取得了显著进展,包括ECG和MCG。传统的ML方法依赖于人工提取的特征,这些特征往往难以捕捉电生理信号的复杂时间与空间动态。相比之下,深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)以及基于Transformer的架构,展示了直接从原始信号中学习判别特征的能力。然而,这些模型在临床转化过程中仍然面临关键挑战,其中最突出的是“黑箱”特性,这在医疗环境中阻碍了信任和采用。此外,对于不同患者群体和临床情境的模型鲁棒性也引发了关注,进一步强调了需要更加可解释且符合临床需求的解决方案。
在临床实践中,模型的可解释性不仅是一个理想特性,更是关键要求。与传统的计算机视觉任务不同,医疗AI的决策具有高风险,必须透明且易于理解,以确保临床验证的有效性。因此,可解释性人工智能(XAI)技术引起了越来越多的关注,这些技术旨在揭示深度学习模型的内部逻辑,并突出对预测起关键作用的输入区域。欧洲心脏病学会等监管机构和专业组织也强调了在可信赖的医疗AI系统中可解释性的重要性。在心脏电生理领域,可解释性具有双重作用:对于ECG这种已经广泛应用的临床工具,XAI有助于临床医生评估模型决策的合理性,并增强对自动化解读的信任;而对于MCG这种具有潜力但尚未广泛应用的模态,XAI可以帮助识别与诊断相关的空间和时间特征,从而指导临床决策和未来研究方向。
本研究引入了一种新的时空交叉注意力网络,用于多通道心脏信号的分类,同时结合XAI技术以确保模型的可解释性。通过利用Grad-CAM++,该模型能够识别对诊断起关键作用的波形区域,从而与临床专家的经验相一致。所提出的方法在基于ECG的疾病诊断中取得了显著的准确性提升,并将其扩展至基于MCG的心肌缺血检测,进一步确立了新的诊断标准,并增强了MCG在临床中的应用潜力。本研究的主要贡献包括以下几点:
首先,我们设计了一个优化的多尺度组注意力(MSGA)模块,该模块结合了传统坐标注意力、多尺度注意力和通道注意力,专门用于多通道电生理时序信号的分析。这一模块不仅提升了模型对信号特征的提取能力,还增强了其对复杂模式的识别效果。
其次,我们利用Grad-CAM++对模型设计的提取架构进行可视化和分析,从而识别异常的电生理特征。这种方法有效地解决了医疗应用中的可解释性挑战,并提供了经过专家验证的有效证据,证明了其在临床环境中的实用性。
最后,我们将该网络扩展至基于MCG的心肌缺血诊断,取得了0.915的F1分数。通过提供可解释的模型输出和识别的电生理特征,该方法不仅提升了诊断的准确性,还为MCG的未来研究方向提供了指导,从而推动其在临床中的应用。
在模型架构设计方面,我们采用了MSGA-CNN结构,将输入数据视为H×W的图像格式,其中H代表空间通道维度,W代表时间维度。这种设计使得模型能够同时处理多通道信号的空间和时间特性,从而更全面地捕捉心脏电信号的动态变化。此外,我们引入了时空交叉注意力机制,使模型能够在不同时间点和空间位置之间建立有效的关联,进一步提升其对复杂信号模式的识别能力。
在实现细节方面,本研究使用PyTorch框架构建了所提出的时空交叉注意力网络。模型的训练和评估在配备Intel Core i9-13900K CPU和NVIDIA RTX 4090 GPU的工作站上进行,操作系统为Windows 11。模型包含约192万个可训练参数,这在保持模型性能的同时,也确保了其计算效率和资源占用的合理性。训练过程中采用Adam优化器,初始学习率为1×10??,批次大小为64。为了应对类别不平衡的问题,我们使用了加权交叉熵损失函数,以提高模型在不同类别间的识别能力。
在讨论和结论部分,本研究的框架具有轻量级和实时处理能力,适用于高分辨率的ECG和MCG数据,从而在诊断性能和临床适用性之间取得了良好的平衡。通过集成Grad-CAM++,模型提供了可解释的可视化结果,能够定位异常信号区域,为临床医生提供直观的诊断支持。此外,模型的可解释性不仅有助于提高诊断的准确性,还为未来MCG研究指明了方向,推动其在临床环境中的应用。
本研究的成果表明,结合可解释性技术的深度学习模型在心血管疾病的诊断中具有重要的应用价值。这些模型不仅能够提高诊断的准确性,还能增强临床医生对AI辅助诊断的信任,从而推动其在实际医疗场景中的广泛应用。未来的研究可以进一步探索如何将这些可解释性技术应用于其他类型的医疗影像和信号分析,以提高整个医疗AI系统的透明度和可靠性。此外,随着MCG技术的不断发展,我们期待其在临床中的更多应用,为心血管疾病的早期检测和诊断提供更精准的工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号