机器学习模型在急性心肌梗死短期与长期死亡率预测中的系统比较研究

【字体: 时间:2025年06月06日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  为解决急性心肌梗死(AMI)死亡率预测中短期模型(≤1年)与长期模型(≥5年)性能差异不明的问题,上海中医药大学附属岳阳中西医结合医院等机构的研究人员通过回顾性队列研究(4,173例患者),构建了1年、5年及10年死亡率预测模型。研究发现,年龄、BNP(B型钠尿肽)和Killip分级是跨时间段的稳定预测因子,但短期模型无法区分长期生存差异(如1年模型将64%实际5年生存者误判为低风险)。该研究发表于《BMC Medical Informatics and Decision Making》,为临床需根据预测时间窗选择模型提供了实证依据。

  

心血管疾病(CVD)是全球死亡的首要原因,其中急性心肌梗死(AMI)因病情凶险、预后差异大,亟需精准的死亡率预测工具。传统评分系统(如GRACE、TIMI)依赖统计学方法,难以捕捉个体化风险特征。尽管机器学习(ML)模型在短期(≤1年)AMI预测中表现优异,但长期(≥5年)预测模型稀缺,且缺乏系统性比较。这一空白导致临床可能错误依赖短期模型评估长期风险,影响干预策略的制定。

为解决这一问题,上海中医药大学附属岳阳中西医结合医院与上海长海医院的研究团队开展了一项回顾性观察研究,纳入2009-2020年4,173例AMI患者(排除PCI/CABG相关类型),按生存时间分为1年组(3,626例)、5年组(2,102例)和10年组(721例),并设立545例随访超10年的外部测试集。研究收集53项临床变量,采用Borderline SMOTE1处理数据不平衡,结合LASSO和SelectKBest进行特征选择,构建支持向量机(SVM)、随机森林(RF)等模型,通过SHAP值解析关键预测因子。

方法学亮点
研究采用多中心临床数据,通过动态分层抽样和交叉验证确保模型稳健性。特征选择中,LASSO(α=0.0001)保留关键变量,而SHAP值用于量化因子贡献。外部验证集设计独特,包含1-5年、5-10年及>10年生存者,直接比较不同时间窗模型的预测差异。

研究结果

  1. 模型性能差异:1年组RF模型F1-score达97.81%(无需特征选择),5年组LASSO+RF组合最优(F1-score 91.35%),10年组SVM表现最佳(F1-score 80.7%)。短期模型在外部测试中AUROC虽高(如1年模型0.8238),但无法区分长期生存者(全部预测为低风险)。

  2. 跨时间核心预测因子:年龄(SHAP值最高)、BNP和Killip分级在1/5/10年组均位列前15重要特征。年龄增长与死亡风险呈强正相关,印证衰老是AMI预后的独立危险因素。

  3. 时间依赖性特征演变:短期模型(1年)依赖CBC参数(如红细胞压积)和肾功能指标(尿素、肌酐);5年组起血运重建和β受体阻滞剂治疗权重上升;10年组则更关注疾病严重程度(如病变范围)和治疗史,反映生存偏倚。

结论与意义
该研究首次系统验证了AMI预测模型的时间窗特异性:短期模型(如临床常用的1年模型)在长期风险评估中存在显著局限性,可能误导对实际生存≥5年患者的风险分层。这一发现挑战了当前依赖短期数据建立通用预测模型的实践,强调需根据临床目标(如早期干预或长期管理)选择对应时间窗的模型。此外,SHAP分析揭示的跨时间稳定因子(如年龄)和动态演变特征(如治疗干预)为AMI机制研究提供了新视角。

研究发表于《BMC Medical Informatics and Decision Making》,其临床价值在于推动建立更符合实际需求的长期预测体系。未来需扩大队列验证,并探索动态指标变化对模型的优化潜力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号