
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的ST段抬高型心肌梗死后个性化风险评估计算器开发与验证
【字体: 大 中 小 】 时间:2025年08月29日 来源:BMC Cardiovascular Disorders 2.3
编辑推荐:
为解决ST段抬高型心肌梗死(STEMI)后传统风险评分时效性不足、预测精度有限的问题,研究人员开发了基于CatBoost算法的机器学习(ML)模型。该研究纳入3340例患者数据,结果显示模型对1年死亡率预测准确率达95.6%(AUC 0.95),左室射血分数(LVEF)被确认为最强预测因子。这项发表于《BMC Cardiovascular Disorders》的研究为STEMI后精准医疗提供了创新工具。
心血管疾病领域迎来重大突破——一项发表在《BMC Cardiovascular Disorders》的研究成功开发出首个基于机器学习的ST段抬高型心肌梗死(STEMI)个性化风险评估系统。尽管现代介入治疗使STEMI死亡率显著下降,但患者出院后仍面临高达10%的1年死亡风险。传统TIMI和GRACE评分虽广泛应用,但其训练数据来自20世纪末,且采用固定变量的回归模型,难以适应现代患者特征变化。更关键的是,这些评分无法提供个体化的风险因素分析,制约了精准医疗的实施。
为解决这些临床痛点,由Afek Kodesh和Leor Perl领衔的国际团队开展了一项创新研究。他们收集了以色列Rabin医学中心和意大利Turin医院2004-2020年间3340例STEMI患者的全景数据,包括人口统计学指标、实验室检查、影像学参数等42项特征。研究采用CatBoost梯度提升算法构建预测模型,这种机器学习技术能自动处理缺失值,并通过500轮迭代训练优化决策树性能。特别值得注意的是,团队引入SHAP(Shapley Additive exPlanations)可解释性分析,使"黑箱"算法变得透明可视。
关键技术方法包括:1)多中心回顾性队列设计,主要训练集来自以色列中心(n=2887),测试集含以色列321例和意大利132例患者;2)CatBoost机器学习模型配置500轮训练周期,学习率0.1,树深度10;3)采用SHAP分析确定特征重要性;4)主要终点为全因1年死亡率;5)通过校准曲线和综合校准指数(ICI=0.13)验证模型精度。
研究结果方面,几个关键发现尤为突出:
基线特征显示训练组与测试组在年龄(61.4±12.7 vs 59.8±12.4岁,p=0.03)和基线血红蛋白(13.9±1.7 vs 14.3±5.9 g/dL,p=0.01)存在差异,其他参数如BMI、GFR等均保持平衡。
模型性能表现出色,在以色列测试集中达到95.6%准确率(AUC 0.95,95%CI:0.91-0.98),意大利外部验证组也达93.2%准确率(AUC 0.90,95%CI:0.79-0.98)。敏感性高达98.32%,但特异性相对较低(62.5%),提示其更适合作为筛查工具。

SHAP分析揭示左室射血分数(LVEF)是最强预测因子(平均SHAP值0.978),其次是肾小球滤过率(GFR)。LVEF每降低10%,死亡风险呈指数级上升。

最具创新性的是个性化特征图谱功能,如图7所示案例:一位LVEF 30%、GFR 21 mL/min的患者被评估1年生存概率77.2%,而另一位Killip分级Ⅲ级、血红蛋白7.1 g/dL的患者生存概率为80.5%。这种可视化工具使临床医生能直观识别个体患者的危险因素。
研究结论指出,这是首个整合机器学习预测与个性化风险解释的STEMI预后工具。相比传统评分,其优势体现在三方面:1)采用当代患者数据(2004-2020年),更好反映现代血运重建时代的流行病学特征;2)动态学习机制允许持续纳入新数据优化模型;3)SHAP解释功能突破传统算法的"黑箱"局限,为医患沟通提供客观依据。
讨论部分强调,该模型将LVEF的预后价值量化到新高度,支持当前指南将其作为心衰治疗决策阈值。肾功能(GFR)作为第二预测因子的发现,提示STEMI后多器官功能评估的重要性。研究者建议将该工具整合到电子病历系统(EMR),既可辅助临床决策,也能通过可视化风险沟通提升患者依从性。未来需扩大国际多中心验证,并细化终点指标(如区分心血管/非心血管死亡),以进一步提升临床适用性。
生物通微信公众号
知名企业招聘