《JACC: Asia》:XGBoost Model With CMR Features for Prognostic Assessment in Patients With ST-Segment Elevation Myocardial Infarction
编辑推荐:
摘要:背景:针对ST段抬高型心肌梗死(ST-segment elevation myocardial infarction, STEMI)的准确预后模型对于指导临床实践至关重要。目标:本研究旨在构建整合人口统计学、临床和心脏磁共振(cardiac magnet
摘要:背景:针对ST段抬高型心肌梗死(ST-segment elevation myocardial infarction, STEMI)的准确预后模型对于指导临床实践至关重要。目标:本研究旨在构建整合人口统计学、临床和心脏磁共振(cardiac magnetic resonance, CMR)成像变量的预测模型,以预测长期主要不良心脑血管事件(major adverse cardiac and cerebrovascular events, MACCEs)。方法:ST段抬高型心肌梗死患者在直接经皮冠状动脉介入治疗(primary percutaneous coronary intervention, PCI)后1周内和1个月时接受了CMR检查。研究人员使用24个人口统计学、临床和CMR变量构建了4个预测模型(朴素贝叶斯、逻辑回归、K最近邻和XGBoost),用于预测长期随访期间的MACCEs。模型可解释性通过沙普利值(Shapley values)进行评估。结果:共纳入483名患者(中位年龄:59.6岁,四分位距:54.0-65.0岁;中位随访时间:89.3个月;四分位距:60.3-115.4个月)。在随访期间,483名患者中有98名(20.3%)发生了MACCEs。与其他方法相比,XGBoost模型显示出更优的预测性能。关键的CMR预测因子包括微血管阻塞(microvascular obstruction, MVO)、左心室射血分数恢复(left ventricular ejection fraction recovery)、梗死面积、心肌内出血(intramyocardial hemorrhage, IMH)、梗死核心T1和远端心肌T1。在临床特征中,基利普分级(Killip class)、体重指数和年龄最具影响力。远端心肌T1与经皮冠状动脉介入治疗后1个月的左心室射血分数恢复呈负相关(R = ?0.34;95% CI:–0.43至?0.27;P < 0.01)。结论:整合了临床和CMR特征的XGBoost模型能有效预测ST段抬高型心肌梗死患者的长期MACCEs。微血管阻塞成为基于CMR的最重要的预后因素。
论文主体部分解读
**研究背景与问题**
尽管直接经皮冠状动脉介入治疗(primary percutaneous coronary intervention, PCI)和先进的经皮冠状动脉介入治疗后药物治疗已在ST段抬高型心肌梗死(ST-segment elevation myocardial infarction, STEMI)患者中广泛应用多年,但这类患者的长期预后仍然存在差异。准确的风险评估对于识别高危患者、优化临床管理和资源分配至关重要。近年来,心脏磁共振(cardiac magnetic resonance, CMR)成像已成为评估心脏解剖、功能和心肌组织特征的首选方法,许多基于CMR特征的模型已被证明具有预后价值。然而,大多数现有模型主要关注梗死心肌特征(如心肌扭转、延迟钆增强(late gadolinium enhancement, LGE)面积、微血管阻塞(microvascular obstruction, MVO)和心肌内出血(intramyocardial hemorrhage, IMH)),而对传统上被认为是“正常”的远端心肌关注较少。T
1 mapping技术能够量化基于T
1弛豫时间变化的心肌成分改变,近期研究表明,在室壁运动、负荷灌注正常且无LGE的远端心肌中,也可能出现T
1时间升高,这为ST段抬高型心肌梗死患者提供了潜在的独立预后信息。因此,在模型构建中加入T
1相关特征可能提升整体模型性能。同时,机器学习算法在预后模型构建中的应用日益增多,例如极端梯度提升(XGBoost)算法因其计算效率和高性能而备受青睐,但此类模型常因缺乏可解释性而被视为“黑箱”。利用如SHAP(SHapley Additive exPlanations)等技术可以阐明各特征对预测结果的影响,提升模型的可解释性。基于此,本研究旨在构建一个整合临床变量和CMR特征的XGBoost模型,以提升对ST段抬高型心肌梗死患者主要不良心脑血管事件(major adverse cardiac and cerebrovascular events, MACCEs)的预测能力,并与朴素贝叶斯分类器、逻辑回归和K最近邻(k-nearest neighbors, KNN)模型进行比较,同时利用SHAP解释模型,识别关键的临床干预靶点。本研究发表于《JACC: Asia》期刊。
**主要技术方法**
本研究为一项多中心前瞻性注册研究(EARLY-MYO-CMR注册研究),纳入标准为首次诊断为ST段抬高型心肌梗死、症状出现后12小时内成功接受直接经皮冠状动脉介入治疗、并在心肌梗死第一周内完成基线CMR检查的患者。最终共纳入483名患者,按6:4比例随机分为训练集(290例)和测试集(193例)。所有患者在直接经皮冠状动脉介入治疗后1周内和1个月时接受了3.0T磁共振扫描仪的CMR检查。采集和分析的序列包括电影成像、延迟钆增强、微血管阻塞评估和T
1 mapping。关键测量指标包括左心室射血分数(left ventricular ejection fraction, LVEF)及其变化(ΔLVEF)、微血管阻塞体积、基于延迟钆增强的梗死面积、心肌内出血(定性评估)以及梗死核心、梗死周围区和远端心肌的T
1时间。研究从人口统计学、经皮冠状动脉介入治疗过程和CMR特征中提取了24个特征用于模型构建。研究人员构建了四种预测模型:朴素贝叶斯分类器、逻辑回归、K最近邻分类和XGBoost。模型性能通过受试者工作特征曲线下面积(area under the receiver-operating characteristic curve, AUC)、精确率-召回率曲线下面积、F分数、敏感性、特异性、Brier评分等指标进行评估。特征重要性通过SHAP(Shapley Additive exPlanations)值进行分析,并使用单变量和多变量Cox回归分析验证预测因子与主要不良心脑血管事件的相关性。
**研究结果**
**基线临床特征与CMR特征**:在483名患者中,中位随访时间为89.3个月,98名患者(20.3%)发生了主要不良心脑血管事件。与未发生主要不良心脑血管事件的患者相比,发生事件的患者具有更高的基利普分级、更差的1个月左心室射血分数恢复(ΔLVEF)、更大的微血管阻塞体积、更大的梗死面积以及更高的心肌内出血发生率。两组在梗死核心、梗死周围区和远端心肌的T
1时间上无显著差异。
**模型性能比较**:在特征选择后,XGBoost模型在测试集上表现出最佳的总体预测性能,其AUC为0.963,显著优于逻辑回归(AUC 0.900)和K最近邻模型(AUC 0.740)。朴素贝叶斯分类器的AUC(0.972)略高于XGBoost但无统计学显著性,但XGBoost模型在精确率-召回率AUC、F分数、特异性等指标上更优,且Brier评分最低(0.045),表明其校准度良好。在通过约登指数确定的最佳高风险阈值(0.071)下,XGBoost模型的敏感性为97.3%,特异性为97.6%。
**关键预测因子识别**:通过SHAP分析,研究人员确定了XGBoost模型中最重要的预测因子。在CMR相关特征中,微血管阻塞体积是最重要的预后预测因子,其次是梗死面积和1个月左心室射血分数变化(ΔLVEF),随后是心肌内出血、梗死核心T
1时间和远端心肌T
1时间。在临床特征中,基利普分级、体重指数和年龄最具影响力。值得注意的是,全球急性冠状动脉事件注册(Global Registry of Acute Coronary Events, GRACE)评分在模型中并未显示出显著影响。
**特征间关系分析**:研究发现,远端心肌T
1时间与经皮冠状动脉介入治疗后1个月的左心室射血分数恢复呈负相关(R = ?0.34;95% CI: ?0.43至?0.27;P < 0.01),表明基线远端心肌T
1值升高与左心室功能恢复不良相关。此外,当存在微血管阻塞时,梗死核心的T
1时间往往较低。
**与传统统计方法的一致性**:单变量Cox回归分析显示,基利普分级、ΔLVEF、微血管阻塞、心肌内出血、梗死面积和远端心肌T
1时间与主要不良心脑血管事件发生显著相关。多变量Cox回归分析进一步确认了暴饮、基利普分级、P2Y
12受体抑制剂类型、微血管阻塞、ΔLVEF和梗死面积是主要不良心脑血管事件的独立预测因子。这验证了XGBoost模型识别的部分关键特征。
**讨论与结论**
本研究利用多种机器学习算法,构建了一个整合人口统计学、临床和CMR特征的预后模型,用于预测接受直接经皮冠状动脉介入治疗的ST段抬高型心肌梗死患者的长期主要不良心脑血管事件。主要新发现包括:第一,在症状出现后12小时内接受经皮冠状动脉介入治疗的ST段抬高型心肌梗死患者中,XGBoost模型在预测长期主要不良心脑血管事件方面优于朴素贝叶斯、K最近邻和逻辑回归模型。第二,微血管阻塞,而非传统上公认的梗死面积,是XGBoost模型中最重要的特征。第三,较高的基线远端心肌T
1水平与长期主要不良心脑血管事件发生以及经皮冠状动脉介入治疗后1个月左心室射血分数恢复不佳相关。
讨论部分指出,CMR成像是评估心脏功能和组织细节的金标准,但相关研究常因成本和复杂性而样本量有限。XGBoost算法能够很好地处理稀疏数据,适合此类临床预后预测问题。SHAP值分析为模型提供了可解释性,揭示了特征间的协作与重要性。微血管阻塞作为最重要的预测因子,凸显了其对左心室长期重构的关键影响。尽管心肌内出血在Cox回归中显著,但在SHAP分析中排名靠后,可能与其二分类测量方式有关。远端心肌T
1的预后价值在交互敏感的分析中得以体现,提示其作为新型生物标志物的潜力,但其临床影响仍需进一步研究验证。
研究也承认了若干局限性:仅纳入症状出现12小时内成功接受直接经皮冠状动脉介入治疗的患者,可能无法代表所有ST段抬高型心肌梗死人群;心肌内出血为二分类变量,未能定量评估其体积,可能低估其影响;缺乏外部验证;使用二分类分类器而非考虑时间事件的生存分析框架建模主要不良心脑血管事件。
**结论**:基于XGBoost算法、整合了人口统计学、临床和CMR特征的模型能够最优地预测ST段抬高型心肌梗死患者经皮冠状动脉介入治疗后的长期主要不良心脑血管事件发生率。微血管阻塞体积是最重要的预测因子。远端心肌T
1的价值仍有待探索。