开发一种可解释的机器学习模型以预测脓毒症患者的死亡风险:来自真实世界临床数据的洞察

《Shock》:Development of an Explainable Machine Learning Model to Predict Mortality Risk in Sepsis Patients: insights from a real-world clinical data

【字体: 时间:2025年10月28日 来源:Shock 2.9

编辑推荐:

  本研究利用树基集成分类器构建脓毒症死亡率预测模型,结合SHAP方法进行解释分析。通过SMOTE处理数据不平衡,比较7种模型发现随机森林AUC最优(0.9816)。全局和局部解释揭示了关键风险因素,为临床决策提供依据。

  

背景:

败血症是一种严重的全身性炎症反应,通常由感染引发。当身体对感染的反应失调时,可能导致器官功能障碍、组织损伤甚至死亡。败血症可以影响所有年龄段的人,但老年人、免疫系统较弱的人以及患有慢性疾病的人风险更高。及时诊断和立即干预对于提高生存机会至关重要。

目的:

本研究旨在利用基于树的集成分类器开发一个败血症患者的死亡风险预测模型,并通过Shapley加性解释(SHAP)进行事后解释,以支持临床决策。

方法:

收集了新疆医科大学第一附属医院重症监护病房(ICU)收治的败血症患者的临床数据。使用mice包处理缺失数据,并应用合成少数样本过采样技术(SMOTE)来增加少数类的样本数量,以解决数据不平衡问题。我们应用了七种模型,包括随机森林(RF)、k-近邻(KNN)、支持向量机(SVM)、逻辑回归、极端梯度提升(XGBoost)、逻辑Lasso回归(Logistic_Lasso)和Light梯度提升机(LightGBM),并使用接收者操作特征曲线下面积(AUC)、精确度-召回率曲线(PR)和决策曲线分析(DCA)来比较它们的预测性能。基于这些模型,我们应用了全局和局部解释方法来阐明模型预测并探索败血症患者的预后风险因素。

结果:

在七种机器学习(ML)模型中,随机森林(RF)模型表现最佳,AUC达到了0.9816。同时应用了全局和局部可解释性技术来解释ML模型的决策机制。

结论:

局部解释方法可以说明ML模型是如何对个体结果进行预测的。全局解释技术有助于揭示ML模型在整个特征空间中的响应情况。

通俗语言总结:本研究开发了一个使用基于树的集成分类器来预测败血症患者死亡风险的模型,并通过SHAP提供解释以辅助临床决策。分析了新疆医科大学ICU患者的数据,使用了多种机器学习模型,其中随机森林(RF)的表现最好,AUC为0.9816。采用SMOTE等技术来平衡数据,并应用了全局和局部解释方法来理解模型预测。该研究强调了机器学习在通过识别关键风险因素和改善决策过程来改善败血症预后方面的潜力。

文本由机器生成,可能存在不准确之处。常见问题解答

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号