基于机器学习的结肠癌患者全结肠系膜切除术后心力衰竭风险预测模型构建及临床验证

【字体: 时间:2025年07月16日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对结肠癌患者全结肠系膜切除术(CME)后心力衰竭(HF)这一严重并发症,通过机器学习算法(XGBoost/RF/SVM/KNN)构建预测模型,筛选出年龄≥65岁、BMI≥25 kg/m2、术前/术中心动过速等12项独立危险因素,最终XGBoost模型在训练集和验证集的AUC分别达0.990和0.941,为临床早期识别高风险患者提供精准工具。

  

在消化道肿瘤治疗领域,结肠癌全结肠系膜切除术(CME)作为根治性手术的金标准,虽能显著改善患者预后,但术后高达14.85%的心力衰竭(HF)发生率成为困扰临床的难题。随着人口老龄化加剧,合并心血管基础疾病的患者比例持续攀升,如何精准识别HF高风险群体成为亟待解决的临床痛点。传统预测方法受限于单因素分析的局限性,难以捕捉多因素交互作用,而新兴的机器学习技术为这一难题提供了突破契机。

南京医科大学无锡医学中心的研究团队在《Scientific Reports》发表了一项开创性研究,通过整合1158例结肠癌患者的37项临床特征变量,首次采用极端梯度提升(XGBoost)、随机森林(RF)等四种机器学习算法构建预测模型。研究发现,XGBoost模型展现出卓越的预测效能,其训练集AUC值高达0.990,外部验证集AUC达0.93,显著优于传统统计方法。通过SHAP分析揭示,年龄≥65岁、慢性阻塞性肺病(COPD)病史、术中心动过速等是影响预测的最关键因素。

研究团队采用多中心回顾性队列设计,关键技术包括:1)从无锡人民医院数据库提取2010-2018年接受CME手术的结肠癌患者数据;2)应用10折交叉验证评估模型稳定性;3)通过受试者工作特征曲线(ROC)、校准曲线和决策曲线分析(DCA)多维度验证模型性能;4)采用SHAP值解析特征重要性。

风险因素分析

通过单因素与多因素Logistic回归,确认年龄、BMI、吸烟史等12项指标为独立危险因素。机器学习特征重要性排序显示,高龄患者发生HF的风险是年轻患者的3.329倍(95%CI:1.304-8.83),而术中输血患者的风险激增至10.438倍(95%CI:4.288-27.675)。

模型性能比较

XGBoost在内部验证集展现最优 discriminative能力:训练集灵敏度0.983(0.976-0.990),验证集特异性0.875(0.845-0.905)。校准曲线显示预测概率与实际观测值高度吻合,DCA证实模型在阈值概率0.1-0.8区间具有显著临床净获益。

临床个案解析

SHAP力图示例如显示,1例同时存在NLR≥3、CRP≥10 mg/L、COPD病史的患者,模型预测HF概率达95.8%。而仅具BMI≥25 kg/m2等低风险特征的患者,预测概率仅0.4%,完美诠释模型的个体化预测能力。

这项研究首次将机器学习应用于CME术后HF预测,其创新价值体现在三方面:首先,模型整合术前检查、术中指标等多维数据,突破传统评分系统的维度限制;其次,XGBoost算法通过正则化处理有效避免过拟合,保证模型泛化能力;最重要的是,SHAP解释框架使"黑箱"预测可视化,帮助临床理解决策逻辑。研究结果对优化围手术期管理具有直接指导意义——对高风险患者可提前强化心功能监测,调整β受体阻滞剂等治疗方案,从而降低HF发生率。

研究也存在若干局限:未纳入术后用药依从性等动态因素;单中心数据可能影响模型普适性;化疗药物心脏毒性未纳入分析。未来需通过前瞻性多中心研究进一步优化模型,并探索与电子病历系统的实时对接,最终实现临床决策支持系统的落地应用。这项成果为外科并发症预测树立了新范式,其方法论可扩展至其他重大手术的风险评估领域。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号