人工智能增强心电图模型的可解释性代价：性能与解释力的权衡分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《npj Digital Medicine》：The cost of explainability in artificial intelligence-enhanced electrocardiogram models

【字体：大中小】 时间：2025年12月06日 来源：npj Digital Medicine 15.1

编辑推荐：

　　本文聚焦人工智能增强心电图（AI-ECG）模型临床应用中的"黑箱"难题，研究者通过开发新型VAE-SCAN框架系统探讨了心电图特征编码与临床因素间的双向可解释关联。研究发现高容量β-VAE能显著提升心电图形态特征编码能力（Pearson's R=1.0），但模型的可解释性约束会导致预测性能下降（如死亡率预测AUC从0.87降至0.72）。该研究为可解释人工智能（XAI）在心血管医学领域的应用提供了重要方法论参考。

随着深度学习技术在医疗领域的广泛应用，人工智能增强心电图（AI-ECG）模型在心血管疾病的诊断和预后预测中展现出卓越性能。然而，这些模型的"黑箱"特性严重阻碍了其在临床实践中的推广应用。当前临床实践中， cardiologists主要依赖传统心电图参数（如心率、节律、PQRST波振幅/间期等）进行诊断，但这些参数可能忽略更细微、分布式或复杂的模式。与此同时，许多事后可解释性（post-hoc XAI）技术被证明存在不可靠、不一致的问题，促使研究重点转向固有（ante-hoc）可解释性技术。

在这项发表于《npj Digital Medicine》的研究中，研究人员系统探讨了AI-ECG模型中可解释性与预测性能之间的权衡关系。他们开发了一种新型VAE-SCAN框架，通过变分自编码器（VAE）学习本质上可解释的心电图特征，并研究不同表征如何影响具有不同可解释性水平模型的心电图解码性能。

研究采用两个真实世界临床数据集：包含1,169,387份心电图的BIDMC（二级医疗）队列和包含2,202,555份心电图的CODE（初级医疗）队列。关键技术方法包括：基于退火β-VAE框架的心电图特征编码、符号概念关联网络（SCAN）构建、以及多种基线模型（ResNet、MLP、线性模型）的对比评估。研究重点分析了年龄预测（回归）、性别分类和5年死亡率风险预测三个典型心电图解码任务。

退火β-VAE框架改进心电图特征编码

研究人员采用退火β-VAE框架训练卷积编码器/解码器架构，处理中位数心跳心电图（8导联，1.2秒）。随着目标编码容量C_max从25增加至200纳特（nats），模型利用的信息因子数量从18个增至51个，重建精度显著提升（MAE从0.014mV降至0.007mV）。当结合两个数据集训练时，模型进一步扩展至80个潜在因子，达到最佳性能（250纳特，0.006mV MAE）。

高容量β-VAE表征引入丰富的形态学变异

可视化分析显示，高容量模型能够编码更细微的形态学变异，如准确捕捉QRS振幅峰值和T波形态相移，而低容量模型在这些方面存在编码不足。

预测性能依赖于心电图特征的解耦和信息容量

在不同容量VAE特征的解码任务中，性能随容量增加而逐步提升。年龄预测的MAE从9.71降至8.52，性别分类的AUC从0.80升至0.84。多层感知器（MLP）与线性模型间的性能差异表明，发现的ECG因子存在一定程度的纠缠。

VAE-SCAN框架实现临床因素的双向心电图解读

VAE-SCAN框架通过将预训练的β-VAE特征与临床概念相关联，实现了样本级和模型级的可解释性。该框架能够学习稀疏关联，无需大量心电图-标签对，特别适用于低患病率疾病。

VAE-SCAN模型级可解释性与临床心电图解读兼容

通过将潜在因子遍历投影回心电图空间，研究人员发现了与临床知识一致的心电图生物标志物。年龄相关变化显示左轴偏离（LAD）、PR间期延长、QRS振幅全局衰减等特征；性别差异显示男性前R-S振幅增加、T波振幅增高；高死亡率风险显示LAD、QRS波群增宽、T波低平或倒置等特征。

基线AI-ECG模型与VAE基方法比较

与传统ResNet模型相比，基于中位数心跳的模型在年龄和性别预测中表现相当，但在死亡率风险预测中性能下降3.45%。β-VAE重建信号训练的ResNet模型出现更明显的性能下降（平均5.19%），表明β-VAE的正则化和编码/解码容量导致信息丢失。

β-VAE丢弃基线AI-ECG模型利用的罕见和细微形态学变异

性能比较显示，β-VAE会丢弃基线AI-ECG模型利用的罕见和细微形态学变异，这些变异可能反映临床相关生物标志物（如起搏信号或肌肉颤动）。

特征纠缠阻碍心电图可解释性和预测性能

可解释方法（线性模型和SCAN）相对于MLP网络出现性能下降，线性模型平均下降11.22%，SCAN额外下降5.33%。这种约束源于SCAN依赖于发现良好解耦的概念相关潜在分布。

研究结论强调，在AI-ECG模型中施加更强的可解释性约束（如通过SCAN或线性模型）可以在群体和个体水平揭示有价值的临床见解，但以降低预测能力为代价。与不受约束的深度学习架构相比，这种权衡在心血管医学应用中需要谨慎平衡。VAE-SCAN框架满足可解释人工智能（XAI）对保真度、鲁棒性和领域可解释性的要求，为生物标志物发现和模型理解提供了新途径。

研究还发现，基于VAE特征的模型在不同输入条件下表现出改进的鲁棒性，而基于原始心电图的深度学习模型在特征提取方面具有灵活性，但可能对噪声输入扰动产生不稳定性。这种差异强调了表征学习和训练策略作为开发可信赖XAI关键步骤的重要性。

该研究为心电图分析中的可解释人工智能建立了系统基准，揭示了表征复杂性与临床可解释性之间的基本权衡，为未来心血管人工智能研究提供了重要方法论基础。随着可解释性需求的日益增长，这种基于VAE的方法有望在临床决策支持系统中发挥重要作用，促进人工智能在心血管医学中的更广泛应用。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号