基于长期动态心电图(Ambulatory Electrocardiography)的深部神经网络(Deep Neural Networks)自动检测心房颤动(Atrial Fibrillation):回顾性诊断准确性研究
《JMIR Cardio》:Deep Neural Networks for Automatic Atrial Fibrillation Detection Using Long-Term Ambulatory Electrocardiography: Retrospective Diagnostic Accuracy Study
编辑推荐:
心房颤动(Atrial Fibrillation, AF)是全球成人中最常见的心律失常,影响2%至4%的人群,并与卒中风险增加相关。早期诊断AF及心房扑动(Atrial Flutter, AFL)至关重要,因其具有卒中风险且常呈无症状和阵发性特征。传统心电图(
心房颤动(Atrial Fibrillation, AF)是全球成人中最常见的心律失常,影响2%至4%的人群,并与卒中风险增加相关。早期诊断AF及心房扑动(Atrial Flutter, AFL)至关重要,因其具有卒中风险且常呈无症状和阵发性特征。传统心电图(Electrocardiogram, ECG)判读需大量专家投入,尤其在ECG质量不佳时更具挑战性。本研究旨在评估深部神经网络(Deep Neural Network, DNN)模型从大型异质性长期动态ECG记录中检测AF/AFL的性能,包括来自一所大学医院6个月期间的临床数据,并评估其在反映真实世界临床数据多样性和复杂性场景中的有效性。研究整合了总计10,248例患者的公开数据集、既往研究中的648例患者的ECG数据,以及库奥皮奥大学医院(Kuopio University Hospital, KUH)4346例患者的真实长期ECG记录用于DNN模型开发。该模型的临床准确性和可推广性通过包含1010例患者103 downloaded.039份假名化长期ECG记录的独立测试数据集进行评估,所有记录均经专家仔细审核和标注。DNN模型表现出高效能,在时间级别AF及AFL检测中达到96.4%的灵敏度(Sensitivity)和超过99.99%的特异度(Specificity)。在记录级别,其识别AF和AFL的灵敏度为100%,特异度为98.77%,仅在1.2%(11/897)的记录中产生假阳性结果,其中81.8%(9/11)存在其他非AF/AFL心律失常。该模型在不同患者特征中均保持高性能,包括不同年龄、合并症、共存心律失常及低质量ECG记录。研究结果表明,所提出的DNN模型可支持长期动态ECG记录中AF和AFL的自动化筛查,并可能减少临床实践中的手动审核工作量。
心房颤动(Atrial Fibrillation, AF) 作为全球最常见的心律失常,影响2%至4%的成人人口,且与卒中风险增加及重大医疗支出相关。随着人口老龄化,AF与心房扑动(Atrial Flutter, AFL)的患病率预计到2060年将增长2.3倍。AF和AFL的诊断需要心电图(Electrocardiogram, ECG)记录证实,但二者常呈间歇性和无症状性,标准24或48小时ECG记录往往不足以检测,使得早期发现和预防面临挑战。从自动化ECG分析角度看,AFL因房室(Atrioventricular, AV)传导变异性而构成特殊挑战,可变AV传导导致的不规则心室反应在体表ECG上与AF极为相似,易造成基于RR间期不规则性的规则方法和深度学习方法误判。此外,室上性期前收缩(Supraventricular Ectopic Beats, SVEBs)、AV传导异常、房性心动过速等多种心律失常均可模拟AF或AFL,增加自动分析假阳性风险 Creat风险。近年来,可穿戴单通道ECG设备使长达数周的记录成为可能,但这类记录通常包含10%至30%的噪声数是由于运动干扰或肌肉活动所致,对当代分析技术提出重大挑战。与传统逐步式自动心律失常分析方法不同,深度神经网络(Deep Neural Network, DNN)提供端到端的原始ECG数据处理能力,有望从大量未处理数据中发现新的诊断特征。既往多数DNN模型基于小型公共数据库开发,局限于有限记录数量,限制了模型的可推广性;少数研究虽应用于长期动态记录,但未在真实世界临床数据集的全记录或患者层面评估性能。
针对上述问题,研究人员开展了一项旨在评估DNN模型从大型异质性长期动态ECG记录中自动检测AF/AFL性能的研究,论文发表于《JMIR Cardio》。该研究使用残差网络(ResNet)作为核心架构,在每两个卷积层之间加入捷径连接以解决梯度消失问题。模型以10秒原始ECG数据为输入,包含3通道、采样率125Hz,无需额外患者信息,将输入分类为AF或AFL、非AF/AFL、不可分析三类。网络权重采用He初始化方法,优化器为Adam,批量大小128,初始学习率10
-3,dropout概率0.1以防止过拟合。模型超参数包括卷积层数、滤波器数量、滤波器大小和dropout率均通过网格搜索优化,最终网络包含37个卷积层,初始使用16个长度为12的滤波器,每4层后滤波器数量增加。模型输出经后处理以考虑检测节律的时间连续性:短于30秒的AF检测被排除,紧邻的临床显著AF和AFL片段以4分钟窗口合并为统一发作。评估在时间级别和记录级别进行:时间级别通过比较每秒标注与最近预测;记录级别以存在至少一个正确检测的30秒AF或AFL片段为真阳性,无任何30秒序列预测AF/AFL者为真阴性。
研究结果显示,最终测试数据集包含1010例独特个体的1039份三通道ECG记录,持续时间24至48小时,患者平均年龄60.37岁,48%为男性。AF或AFL存在于13.7%的记录中,共25,072小时ECG数据,其中3,028.8小时为AF和AFL。
时间级别AF和AFL检测方面,DNN模型正确分类2,918.2小时为AF或AFL,时间级别灵敏度达96.4%,特异度超过99.99%,阳性预测值(Positive Predictive Value, PPV)99.96%,阴性预测值(Negative Predictive Value, NPV)99.5%。93.7%的AF和AFL记录时间级别灵敏度大于90%;灵敏度低于90%的9份记录均为AFL伴2:1、3:1或4:1传导比例,其中部分F波与QRS波群融合。记录级别AF和AFL检测中,模型在所有142份含AF或AFL的记录中正确检出至少一个超过30秒的片段,灵敏度100%;897份无AF或AFL记录中,仅11份(1.2%)出现假阳性,特异度98.77%,PPV 92.81%,其中81.8%为其他真正心律失常。模型正确分类91.3/92.9小时的不可分析ECG数据;将25.8小时临床可分析数据误判为不可分析,常见原因为2通道存在大幅ECG伪差而仅1通道可见R峰。亚组分析显示,非AF心律失常负担较低记录中AF和AFL检测灵敏度最低,非AF心律失常负担较高记录中灵敏度和PPV均最低。
讨论部分指出,该研究全面展示了深度学习方法从大量真实临床患者长期动态ECG记录中进行自动AF和AFL检测的能力。DNN模型成功识别所有AF和AFL患者,假阳性率极低,证明了端到端DNN方法显著提高 long-term ambulatory ECG分析算法解读精度的潜力。与既往研究相比,本研究利用大量异质性真实世界数据训练,在保持可比拟灵敏度的同时显著提高了特异度和PPV。研究强调,DNN模型应被视为筛查和决策支持工具而非独立诊断系统,因 learned features无法直接与已确立的生理学标志物关联。模型局限性包括:排除起搏器患者可能导致特异度高估;单中心测试数据集种族多样性及ECG设备变异有限;阵发性AF患者被排除可能影响训练;固定2:1 AV传导比例AFL的时间级别灵敏度降低构成临床相关局限;4分钟合并窗口可能导致AF负担高估,特别是多个短发作近距离发生时。
研究结论指出,该研究结果证实了DNN模型在动态环境中进行AF和AFL诊断的高灵敏度和高特异度潜力。经充分数据训练后,DNN模型能够区分运动伪差导致的ECG变化与AF和AFL,假阳性率低。所提出的自动化检测系统可简化诊断流程和临床工作流,低假警报率支持其临床应用。