编辑推荐:
心脏性猝死在理论上可以通过除颤器预防。然而,每年都有许多患者因医生未能预测其风险而在没有除颤器的情况下死亡。目前广泛使用的唯一预测性生物标志物——心脏左心室射血分数(LVEF)——会漏诊大多数心脏性猝死病例,并且会将许多低风险患者错误地标记为需要植入无效的除颤
心脏性猝死在理论上可以通过除颤器预防。然而,每年都有许多患者因医生未能预测其风险而在没有除颤器的情况下死亡。目前广泛使用的唯一预测性生物标志物——心脏左心室射血分数(LVEF)——会漏诊大多数心脏性猝死病例,并且会将许多低风险患者错误地标记为需要植入无效的除颤器。本研究将深度学习应用于一个将瑞典某地区所有心电图(ECG)与死亡证明相关联的数据集。由此产生的模型识别出一个高风险组(占样本的2.2%),其心脏性猝死年发生率为7.0%,高于LVEF降低的患者组(占样本的1.9%;年发生率4.6%)。值得注意的是,该模型识别出的高风险患者中,有86.1%未被LVEF标记。植入除颤器的高风险心电图患者死亡风险比预期降低了54.4%,提示存在死亡率获益。研究人员在美国的一个医疗系统中对该模型进行了外部验证,该模型预测了导致猝死的心室心律失常;并在台湾的一个医院登记系统中进行了验证,该模型特异性地预测了未来的心律失常性心脏骤停。为了可视化预测模型所“发现”的波形形态特征,研究人员将其与一个心电图波形的生成模型配对。两者共同揭示了一个易于观察、能稳健预测心脏性猝死,但据研究人员所知此前未被描述过的生物标志物。通过将该生物标志物的形态与电生理学基本原理联系起来,研究人员提出并初步验证了一个关于心脏性猝死机制的新假说。
**研究背景与问题**
心脏性猝死是全球范围内导致死亡的主要原因之一,每年仅在美国就造成数十万人死亡。自1980年代植入式心律转复除颤器(ICD)问世以来,其能够检测并终止致命性心律失常,从而预防猝死。然而,ICD植入存在成本与风险,因此准确识别高危患者至关重要。目前临床实践中广泛使用的风险预测金标准是左心室射血分数(LVEF),该指标通过心脏超声测量。LVEF降低确实与猝死高风险相关,且ICD能为这类患者带来显著的生存获益。但LVEF存在明显局限性:首先,其假阴性率高,大多数猝死患者生前并未测量LVEF,或测量结果正常;其次,其假阳性率也高,大量因LVEF降低而植入ICD的患者从未接受过救命电击,承受了植入风险却未获益。尽管认识到LVEF的不足促使学界呼吁开发新方法,但由于其测量标准化、普及性高等实用优势,LVEF仍是目前唯一广泛应用的预测指标。其他有潜力的诊断方式,如心脏磁共振成像(cMRI)、长程动态心电监测、电生理检查等,或因成本高昂、操作有风险,不适合大规模人群筛查。另一方面,心电图(ECG)虽然廉价普及,但传统上依赖人工解读提取生物标志物,存在主观差异且预测效能不足,无法与LVEF竞争。
**研究目的与意义**
本研究旨在利用深度学习技术,开发一种基于ECG的新型风险预测模型,以克服LVEF的局限性,更准确、高效地识别心脏性猝死高危人群,并为理解猝死机制提供新线索。该研究具有重要的临床转化潜力,若成功,可望优化ICD植入决策,挽救更多生命。相关成果发表于《自然》杂志。
**关键技术方法**
研究人员主要采用了以下关键技术方法:
1. **数据构建与处理**:研究基于瑞典一个地区2010-2016年间所有441,614份心电图数据,并将其与全国死亡证明和电子健康记录精确链接,构建了大规模、基于人群的训练数据集。为确保模型评估的严谨性,预先设立了占总数40%的独立数据“保险箱”,在模型训练和初步分析阶段完全隔离,仅在论文被《自然》杂志有条件接受后才用于最终验证。
2. **深度学习预测模型**:采用了一个64层的残差神经网络(ResNet)架构。模型通过多任务学习进行训练,主要目标是预测基于死亡证明的心脏性猝死一年内风险,同时辅助预测死亡原因(猝死vs其他)以及LVEF降低状态,以增强模型的表征学习能力。
3. **生成模型与特征可视化**:为了解读预测模型所依赖的ECG形态特征,研究人员训练了一个变分自编码器(VAE)作为ECG波形的生成模型。通过将预测模型与生成模型结合,利用梯度上升方法在VAE的潜在空间中探索,能够系统性地将低风险ECG波形“变形”为高风险的反事实波形,从而直观揭示与风险相关的关键形态变化。
4. **外部验证与泛化性评估**:为了检验模型的普适性,研究团队在来自美国(Sharp HealthCare系统)和台湾(国立台湾大学医院)的两个独立、异构的外部数据集上进行了“零样本”验证,评估模型对不同人群、不同结局定义(如心室颤动/室性心动过速(VF/VT)诊断、心律失常性心脏骤停)的预测能力。
**研究结果**
**1. 在瑞典数据中的预测性能**
模型在独立“保险箱”数据集中表现出优异的区分度,受试者工作特征曲线下面积(AUC)为0.872。通过设定风险阈值,研究人员定义了一个占样本2.2%的高风险组,其基于死亡证明的心脏性猝死年发生率为7.0%,显著高于LVEF降低组(1.9%样本,年发生率4.6%)。该阈值的选择参考了主要ICD随机对照试验中对照组患者的猝死风险中位数。进一步分析显示,高风险组患者每年还有额外的3.8%发生VF/VT。
**2. 模型在美国和台湾数据中的泛化能力**
在美国数据集中,模型预测VF/VT的AUC为0.822。使用与瑞典相似规模的高风险组(风险最高的2.2%),其VF/VT年发生率高达29.1%。在台湾基于医院的病例对照登记数据中,模型能够区分未来发生心律失常性心脏骤停的患者与对照组,AUC为0.767。重要的是,模型对非心律失常性心脏骤停的预测性能接近随机猜测(AUC 0.582),表明其特异性针对心律失常性死亡。
**3. 高风险患者植入除颤器与死亡率的关系**
观察性分析显示,在瑞典数据中,植入ICD的高风险ECG患者,其心脏性猝死风险比预期降低了54.4%,全因死亡率降低了39.0%。作为对照,在已知的LVEF降低患者中,模型也“重新发现”了ICD带来的显著死亡率降低(67.5%),这与随机试验结果一致,为分析框架提供了表面效度验证。
**4. ECG模型与LVEF的比较**
ECG模型识别的高风险患者中,仅有13.9%已知LVEF降低,表明模型发现了大量未被LVEF识别的新高危人群。高风险ECG组的猝死率(7.0%)高于LVEF降低组(4.6%)。当两种生物标志物同时提示高风险时,患者猝死率高达10.7%。
**5. 模型发现的ECG生物标志物**
通过生成模型的可视化技术,研究人员观察到高风险ECG波形形态存在系统性变化,包括额面电轴左偏(与左前分支传导阻滞(LAFB)一致)和横面R波进展不良。更重要的是,在aVL导联发现了一个此前未被描述的形态特征:高风险患者QRS波群终末部分R波降支变得顿挫(slurred),取代了低风险波形中尖锐的S波。定量分析证实,从R波峰值到QRS波终点区间内aVL振幅的一阶和二阶绝对差均值,是猝死风险的独立预测因子,其预测效力与电轴左偏相当。单导联模型分析提示,预测信号弥漫分布于整个心肌。
**6. 临床与科学启示及初步机制探讨**
研究结果提示,ECG模型识别的高风险患者代表了一个新的、此前未被怀疑的、死亡频发且可预防的人群,为开展ICD随机试验提供了依据。在科学层面,该研究为探索猝死机制开辟了新途径。基于观察到的aVL导联顿挫形态,研究人员提出了一个初步假说:这可能是由于去极化过程中电传导波前因遇到弥漫分布的障碍物(如心肌纤维化)而发生多次分裂(散射)所致,导致记录到的平均电向量随时间变得越来越正交或紊乱。为寻找支持性证据,研究人员对验证集中少数患者的心脏磁共振(cMRI)图像进行了盲法评估,发现风险预测最高的10%患者中,左心室存在细微、弥漫性晚期钆增强(LGE)的比例显著更高,这通常与心肌纤维化相关。纤维化作为一种弥漫性改变传导的病理过程,可能是连接该ECG生物标志物与心脏性猝死的潜在机制。
**讨论与结论**
**讨论部分总结**:研究讨论了ECG深度学习模型在猝死风险预测方面的显著优势,包括其成本效益、可扩展性以及能够发现传统方法遗漏的高危患者。同时,也指出了当前研究的局限性,例如观察性分析中存在的未测量混杂因素可能影响ICD获益的估计,以及需要在前瞻性随机试验中最终验证临床效用。研究提出的纤维化假说为理解猝死机制提供了新视角,但需要未来更多研究(如心内膜心肌活检与ECG、cMRI的相关性研究)加以证实。研究还展望了未来方向,包括将生成模型与心脏计算模型结合以深入探究机制,以及对前瞻性识别的高危患者进行更详细的数据收集和功能学研究。
**研究结论翻译**:深度学习在来自三个大陆的数据中识别出了心脏性猝死高风险的新患者群体。这些高风险患者被医生所忽视,并且可能从除颤器中获益,这一观察结果具有重大的实际意义。此外,该模型为详细研究这一普遍存在的悲剧性医学谜题提出了新的途径。