编辑推荐:
Yang等人提出了一种新的方法,使用标准的12导联原始心电图(ECG)追踪来识别与房颤(AF)风险相关的特征。本研究中确定的特征是直观的,可以为房颤发展之前的ECG变化提供见解。
从 12 导联心电图中提取功能特征识别房颤:研究解读
宾夕法尼亚大学佩雷尔曼医学院生物统计学、流行病学和信息学系的 Wei Yang 等人在Communications Medicine期刊上发表了题为 “Functional feature extraction and validation from twelve-lead electrocardiograms to identify atrial fibrillation” 的论文。该研究提出一种非参数特征提取方法,用于识别与房颤发展相关的心电图特征,这一成果对房颤的诊断和治疗具有重要意义,为临床医生理解房颤发生前心电图的变化提供了新视角,有望改善房颤患者的诊疗现状。
一、研究背景
深度学习方法在利用标准 12 导联心电图(ECG)识别房颤高危个体方面展现出一定能力,能在人群层面辅助筛查和风险分层。然而,其过程犹如 “黑箱”,临床医生难以从中了解个体层面的心电图变化。特别是对于最终发展为房颤患者的窦性心律心电图特征,目前仍知之甚少。
在疾病检测和分类领域,深度学习虽潜力巨大,可直接处理原始数据,无需手动特征提取,但也存在局限性。一方面,深度学习结果背后的原理难以理解;另一方面,其训练需要大量样本,通常来源于电子健康记录,难以充分发挥传统队列研究的优势,无法有效利用纵向数据探究疾病的细微进展。相比之下,特征提取旨在将原始数据转化为一组精简且有意义的特征,用于后续分析。功能主成分分析(fPCA)作为一种非参数数据驱动的特征提取方法,以连续曲线为数据分析基本单元,能考虑数据的时间顺序,所提取的特征具有直观的解释性,还可在个体层面纵向评估,有助于捕捉疾病的细微变化,为疾病预测提供可能。
二、研究材料与方法
(一)研究对象
本研究数据来源于慢性肾功能不全队列(CRIC)研究。该研究由美国国立糖尿病、消化和肾脏疾病研究所于 2001 年发起,是一项针对慢性肾脏病(CKD)患者的前瞻性队列研究。在 CRIC 研究的第一阶段(2003 - 2008 年),通过全国 7 个临床中心招募了 3939 名个体;在第三阶段(2013 - 2015 年),又招募了 1686 名 CKD 患者。本研究选取在招募时无心血管疾病病史的个体作为研究对象,其中第一阶段 2623 名,第三阶段 1116 名。
(二)心电图采集与预处理
所有研究对象每年在常规临床研究访视时,使用标准程序和相同设备(MAC 1200;GE 医疗系统信息技术公司)记录 12 导联心电图。数字化记录的心电图传输至维克森林大学的心电图阅读中心,经人工视觉检查质量后,采用 2001 版 GE Marquette 12 - SL 程序自动处理。原始心电图以 500Hz 的频率数字化记录 10 秒,约包含 10 个心跳周期,取每个导联内各周期的中位数作为原始描记。原始心电图需进行预处理,先减去 P 波起始前 0.1 - 0.2 秒的均值,使所有描记初始值为零;再对原始值取平方根并保留符号,然后用 B 样条进行平滑处理;最后去除对应心动周期起始或结束的平坦区域,保留 0.2 - 1 秒的记录数据。
(三)特征提取与选择
运用 fPCA 方法,借助 R 包 fda 对第一阶段 CRIC 研究参与者的原始心电图各导联分别进行处理,选取解释原始描记中 90% 以上变异的前 8 个主成分作为候选心电图特征。对每个导联的 8 个主成分进行 varimax 旋转,以增强可解释性,最终从 12 导联原始心电图中提取出 96 个候选特征,其值为相应的 fPCA 得分,通过计算心电图描记的加权平均值得到,后续分析中计算 fPCA 得分的权重函数固定。
对比发生房颤个体与未发生任何心血管事件(包括心力衰竭、心肌梗死、中风或房颤)或死亡个体的窦性心律心电图候选特征。为突出差异,选取房颤发生前 2 年内最接近的窦性心律心电图(294 例)和随访期间未发生心血管事件个体的基线心电图(1333 例)进行分析,共 1627 份心电图用于横断面特征提取与选择。由于 12 导联相互关联,提取的特征可能代表相似潜在信号,因此进一步筛选。采用 Student t 检验比较发生房颤和未发生房颤个体的衍生心电图特征,选取 P 值小于 0.0005 的特征,经此单变量分析筛选出 47 个特征。再运用逐步选择策略的逻辑回归,以 0.001 为进入和保留模型的 p 值阈值,确定最终的心电图特征列表。通过绘制代表各特征的平均心电图描记图,直观展示所选特征在房颤和非房颤个体间的差异,并构建多变量逻辑回归模型,评估所选特征与房颤的关联。
(四)特征变化评估及与房颤的关联分析
评估最终选定的心电图特征的纵向变化是否可作为房颤的前兆。以第一阶段 CRIC 研究中 2357 名在研究进入后 3 年内收集到至少 2 次心电图的参与者为对象,用首次和末次心电图计算所选特征的变化值,作为房颤发生风险因素进行评估。运用与横断面比较相同的权重函数计算基线和 3 年后心电图的 fPCA 得分,进而得出个体内两次得分的差值。通过绘制纵向心电图记录中所选特征的图形,按房颤发生状态分层展示。构建多变量 Cox 比例风险模型,纳入基线心电图特征及其 3 年变化值作为协变量,研究心电图特征变化与房颤风险的关系。同时,评估所选心电图特征及其随时间的变化是否可作为亚临床疾病进展的潜在替代指标,分析所选特征对已知与房颤相关的基线人口统计学和临床风险因素(如年龄、种族、性别、吸烟状况、体重指数、血压、糖尿病、估计肾小球滤过率和尿蛋白肌酐比)与房颤关联的解释程度。
(五)特征验证
利用 CRIC 研究第三阶段招募的参与者数据验证第一阶段的研究结果。在第三阶段,1077 名参与者采集了心电图,其中 909 名在研究进入后 3 年内至少有 2 次心电图记录。评估这些参与者基线和 3 年随访时的 fPCA 得分,构建多变量 Cox 比例风险模型,纳入所选心电图特征及其 3 年变化值,分析其与房颤发生时间的关系。同时,探究基线临床风险因素与房颤的关联在多大程度上可由所选心电图特征解释。
三、研究结果
(一)研究对象描述
CRIC 研究第一阶段招募的 3939 名个体中,1627 名无心血管疾病病史,用于心电图特征提取和选择。其中 294 名发展为房颤,1333 名未发生房颤及其他心血管事件。这些参与者入组时平均年龄 55 岁,女性占 49%,50% 为白人,34% 为黑人,12% 为西班牙裔,33% 患有糖尿病,平均估计肾小球滤过率为 50mL/min/1.73m2,尿蛋白肌酐比中位数为 0.097。在纵向评估中,纳入 2357 名第一阶段参与者,其特征与用于特征提取和选择的受限人群相似。CRIC 研究第三阶段招募的 909 名参与者用于外部验证,与第一阶段相比,他们年龄更大,黑人参与者更多,基线平均估计肾小球滤过率更高,尿蛋白肌酐比相似。
(二)心电图特征提取与选择
对 12 导联应用功能 PCA 后,每个导联提取 8 个特征,解释了原始描记中 90% 以上的变异。经单变量筛选和逐步回归,最终选定代表 P 波、QRS 波群和 ST 段的 4 个特征,分别来自 II、aVF、V2 和 aVL 导联。与非房颤个体相比,房颤个体的 P 波振幅更低,QRS 波振幅更低,ST 段斜率更低。在其他 11 个导联评估这 4 个特征时发现,P 波相关特征在 I、II、III、aVR 和 aVF 导联差异更明显,其他 3 个特征在特定导联也表现出房颤与非房颤个体间的较大差异。多变量逻辑回归显示,调整其他特征后,这 4 个特征与房颤均相关。所选 P 波振幅特征与 GE Muse 程序中的 P 波测量指标相关性较强,其他所选特征与 Muse 变量相关性较弱。纳入 5 个 Muse 变量进行多变量逻辑回归后,P 波振幅特征的优势比有所减弱,其他所选特征优势比基本不变。
(三)前瞻性评估特征及变化对房颤风险的影响
与未发生房颤的个体相比,发生房颤的个体基线 P 波振幅更低,且随时间下降幅度更大;基线 QRS 波振幅和 ST 段斜率更低,且这些参数下降幅度更大。多变量 Cox 比例风险模型显示,结合基线和纵向变化的心电图参数模型中,基线评估的 4 个心电图特征以及 P 波和 ST 段的变化与房颤发生风险相关,而 QRS 波振幅和另一个 ST 段特征的变化与房颤发展无独立关联。所选心电图特征及其变化解释了基线临床风险因素与房颤关联的 12.8%。纳入 5 个 Muse 变量及其变化进行多变量 Cox 回归后,基线 P 波振幅特征的风险比变得不显著,其他 3 个基线特征仍具有统计学意义,P 波振幅特征变化的风险比基本不变。
(四)外部验证
在第三阶段数据验证中,观察到类似结果。评估的 4 个基线心电图特征中有 3 个以及 P 波特征的变化是房颤发生风险的独立危险因素。基线 P 波特征及其变化的风险估计值最大。与第一阶段参与者相似,心电图特征及其变化解释了临床风险因素与房颤关联的 14.5%。
四、研究结论与讨论
研究人员运用 fPCA 方法,从窦性心律的基线心电图中提取出与房颤发生相关的特征,这些特征独立于已知的反映心房健康的 P 波测量指标。其中,P 波振幅是一个动态风险标志物,3 年内心电图记录中 P 波振幅每下降 1 个标准差,房颤发生风险增加 29%。这一发现凸显了 P 波振幅的重要性,补充了先前关于特定 P 波异常与房颤关联的研究。通过对 3 年年度心电图的纵向分析表明,房颤患者存在进行性心房疾病,表现为心房电压下降幅度超过随时间的自然变化。连续评估 P 波振幅可作为房颤的替代指标,有助于提醒高危患者采取抗凝等预防中风的治疗措施。研究还发现,所选的 4 个心电图特征及其 3 年内的变化,在 CRIC 研究第一阶段和第三阶段数据中,分别解释了临床风险因素与房颤发生率之间关联的 12% 以上,这表明亚临床心脏电生理变化有望用于房颤的提前预测。
与深度学习方法相比,该研究提出的基于 fPCA 的特征提取方法具有独特优势。它能明确突出与房颤相关的特定心电图波形或成分,提取的特征易于解释和可视化。通过固定分析基本单元,可有效模拟特征随时间的细微纵向变化,而深度学习方法在捕捉如 P 波振幅这类细微变化方面存在局限。此外,fPCA 属于无监督特征提取方法,无需对原始心电图设定结构,也无需标记心动周期的不同阶段,在降低原始心电图维度方面效果显著。
然而,本研究也存在一些局限性。在分析心电图原始描记时,未考虑个体间不同心跳周期导致的相位变异性,可能使提取的特征无法准确代表原始描记,未来可探索使用曲线配准技术加以改进。纵向变化评估仅基于个体的两次心电图,增加心电图数量可更准确描述特征变化并强化与房颤的关联。特征提取是逐导联进行的,未考虑不同导联间的相关性,后续可考虑运用多变量 fPCA 同时分析 12 导联描记。虽然利用 CRIC 研究后期招募的个体进行了外部验证,但在真实临床环境(如使用电子健康记录)中进一步验证将更具意义。
总体而言,该研究提出了基于原始心电图数据驱动的特征提取框架,发现 P 波振幅及其纵向变化可作为房颤发展的风险标志物。这一成果为房颤的研究和临床实践提供了新的思路和方法,有助于推动房颤的早期诊断和预防,具有重要的临床价值和研究意义。后续研究可针对现有局限性进一步探索,以完善对房颤的认识和诊疗手段。