构建可解释机器学习模型:精准预测脓毒症患者谵妄风险及影响

【字体: 时间:2025年04月25日 来源:BMC Infectious Diseases 3.4

编辑推荐:

  为解决脓毒症患者谵妄预测及对预后影响评估问题,研究人员基于 MIMIC-IV 数据库开展构建可解释机器学习模型研究。结果显示 XGBoost 模型最佳,谵妄影响 28 天生存率。该研究为临床评估提供工具,推动相关研究发展。

  脓毒症,这个听起来有些陌生却十分危险的病症,是由感染引发的全身性炎症反应综合征,如同身体内部的一场 “风暴”,会导致多器官功能障碍,甚至危及生命。在重症监护病房(ICU)里,脓毒症的发病率和死亡率持续攀升,已然成为全球严峻的公共卫生难题。而在治疗脓毒症患者的过程中,一个 “隐藏杀手” 常常被忽视 —— 谵妄。谵妄是一种急性脑功能障碍,患者会出现意识混乱、注意力不集中、认知功能下降等症状。据统计,全球每年约有 2000 - 3000 万例谵妄病例,在脓毒症患者中,其发病率更是高达 50%。谵妄不仅会延长患者住院时间、增加医疗费用,还与患者长期认知功能障碍密切相关,严重影响患者的生活质量和预后。
目前,虽然对谵妄的流行病学和病因有所研究,但它在脓毒症患者中的具体作用机制仍不明确。现有的谵妄早期预测工具也存在诸多局限性,如缺乏针对脓毒症患者的优化,且解释性不足,难以满足临床需求。因此,如何及时识别脓毒症患者谵妄的发生,并采取有效干预措施,成为改善患者预后的关键。

为了解决这些问题,扬州大学附属苏北人民医院 / 扬州大学临床医学院等机构的研究人员开展了一项极具意义的研究。他们基于 MIMIC-IV(Medical Information Mart for Intensive Care)数据库,构建可解释的机器学习模型,以预测脓毒症患者发生谵妄的风险,并探究谵妄对患者 28 天生存率的影响。该研究成果发表在《BMC Infectious Diseases》杂志上。

研究人员主要运用了以下关键技术方法:首先,从 MIMIC-IV 3.0 数据库获取大量数据,涵盖患者人口统计学信息、感染部位、合并症、实验室指标等多方面内容。然后,通过结构化查询语言(SQL)和 PostgreSQL 15 工具进行数据提取与管理。接着,采用 Lasso 回归和 Boruta 算法进行特征选择,构建了 XGBoost(extreme gradient Boost)、SVM(support vector machine)、Logistic(logistic regression)和 RF(random forest)四种机器学习模型进行预测,并利用 SHAP 方法分析特征重要性,增强模型可解释性。

下面来看看具体的研究结果:

  1. 患者基本特征及临床信息比较:研究共纳入 10321 例脓毒症患者,其中 4691 例(45.45%)发生谵妄。与未发生谵妄的患者相比,发生谵妄患者的年龄、白细胞(WBC)、肌酐(CR)、血尿素氮(BUN)、乳酸(Lac)和钾水平显著更高;血红蛋白(Hb)、血小板(PLT)、钠和氯水平则显著更低。谵妄患者的序贯器官衰竭评估(SOFA)和急性生理学 III(APSIII)评分也更高,且高血压、心力衰竭或肾损伤患者更易发生谵妄,肺部、凝血系统、肝脏、中枢或肾脏感染的患者同样易患谵妄。
  2. 谵妄与脓毒症患者 28 天死亡率的关系:通过 Kaplan - Meier 生存曲线分析发现,谵妄患者 28 天死亡率显著高于未发生谵妄的患者(log-rank P<0.001 )。构建的五个多因素 COX 回归模型进一步验证了这一结果,且随着模型调整因素增多,风险有所降低,但谵妄患者 28 天死亡率仍显著增加。
  3. 谵妄和脓毒症患者 28 天死亡率的中介因果因素分析:研究发现谵妄可能通过年龄、Hb、BUN 和 Lac 影响脓毒症患者 28 天死亡结局。其中,年龄介导效应占谵妄与 28 天死亡率关联的 4.40%,Hb 介导效应占 0.01%,BUN 介导效应占 0.41%,Lac 介导效应占 3.1% ,高血压、心力衰竭和肾损伤等也有不同程度影响。
  4. 脓毒症患者谵妄特征变量筛选:经 Boruta 算法和 Lasso 回归筛选,确定高血压、氯、SOFA 评分、肾损伤、机械通气时间等多个变量与谵妄发生相关。
  5. 多种模型比较:四种机器学习模型中,XGBoost 模型表现最佳。其训练集 AUC 为 0.79(0.75 - 0.83),验证集 AUC 为 0.71(0.67 - 0.74) ,在敏感度、特异度等指标上也更具优势,决策曲线分析(DCA)和校准曲线结果也表明其性能优越。
  6. 可解释性分析:通过 SHAP 值分析,得出各变量对模型预测的贡献程度,高血压、氯、SOFA 评分等变量贡献较大。还绘制了依赖图直观展示指标变化,以及具体病例展示模型预测过程。
  7. 列线图构建:基于 XGBoost 模型,选取高血压、SOFA 评分、氯、Hb 和 CR 五个变量绘制列线图,其预测谵妄模型的 ROC 曲线 AUC 为 0.767(95% CI:0.726 - 0.798) ,校准曲线显示模型预测概率与实际观察结果一致性良好。

研究结论表明,基于 XGBoost 模型构建的列线图为临床医生提供了便捷工具,能快速评估脓毒症患者发生谵妄的风险。这一研究为预测脓毒症患者谵妄的最佳模型提供了新思路和方向,有助于推动谵妄相关研究发展。在临床实践中,早期识别谵妄风险并采取预防措施,对改善脓毒症患者的生存和生活质量意义重大。然而,该研究也存在局限性,如数据来源单一、回顾性设计可能导致选择和信息偏倚等,后续还需在多中心、不同人群中进一步验证模型的普遍性。但总体而言,这项研究为脓毒症患者谵妄的研究和临床管理开辟了新道路,具有重要的理论和实践价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号