基于可解释机器学习模型的ICU导管相关尿路感染患者死亡率预测研究——来自MIMIC-IV数据库的回顾性队列分析

【字体: 时间:2025年09月10日 来源:Frontiers in Medicine 3.0

编辑推荐:

  本研究利用MIMIC-IV数据库,通过四种机器学习模型(XGBoost、决策树、逻辑回归和随机森林)构建ICU导管相关尿路感染(CAUTI)患者死亡率预测模型。结果表明逻辑回归(LR)模型预测效能最佳(AUC=0.871),SHAP可解释性分析识别出血管活性药物使用、休克指数(Shock Index)、急性生理与慢性健康评分Ⅲ(APSIII)和恶性肿瘤为关键预测因子。该研究为临床早期识别高风险患者提供了可解释的人工智能辅助工具。

  

引言

导管相关尿路感染(Catheter-Associated Urinary Tract Infection, CAUTI)是全球重症监护环境中最常见的医疗相关感染之一。流行病学研究显示,CAUTI的发病率在不同医疗体系和经济背景下存在显著差异,范围在每1000导管日中1.3至8.9例之间。在低收入和中等收入国家(LMICs),CAUTI的死亡率高达31.14%。研究指出,CAUTI会使患者平均住院时间延长17.84天,并在美国每例患者产生约1006美元的额外费用。一旦患者被诊断为CAUTI,相关死亡风险约为10%,这给临床和经济带来沉重负担。随着感染风险增加,特别是在危重患者中,准确预测CAUTI相关死亡率的风险至关重要,因为这些信息对于临床决策和资源分配具有重要意义。

近年来,机器学习(Machine Learning, ML)在医疗预测领域的有效性已得到充分证明,例如在极度早产儿(vpi)的延长住院时间(LOS)预测模型设计以及择期心脏手术患者肺炎发病率诊断和预测中的应用。鉴于机器学习算法捕捉非线性关系的固有能力,越来越多的研究者倡导开发新的预测模型以改善患者治疗结局。

本研究旨在利用重症监护医学信息数据库(MIMIC-IV)整合关键临床变量,开发一个可解释模型来预测重症监护室(ICU)中导管相关尿路感染(CAUTI)患者的死亡风险。此外,使用SHapley Additive exPlanations(SHAP)方法解释模型并探讨CAUTI的预后因素。通过深入探索与死亡相关的风险因素,本研究为临床医务人员提供参考。通过在疾病早期识别不良预后结局,可以及时采取干预措施以提高患者生存率,最终改善临床决策和患者结局。

材料与方法

数据来源

这项回顾性研究使用了重症监护医学信息(MIMIC-IV)数据库(v3.1),这是MIMIC-III的迭代版本。该数据库符合HIPAA安全规定并确保数据匿名化。MIMIC-IV包含2008年至2019年间波士顿贝斯以色列女执事医疗中心(BIDMC)7万名成年ICU患者的大量临床数据。

数据库中所有患者数据均为匿名,无需知情同意。遵循1964年《赫尔辛基宣言》及其后续修订的伦理标准,本研究得以进行。在完成美国国立卫生研究院基于网络的培训课程和保护人类研究参与者考试(编号43258214)后,获得了对数据库的访问权限。

参与者选择

通过MIMIC-IV数据库(版本3.1)筛选符合特定标准的患者。我们确定了满足以下条件的个体:

(1)根据国际疾病分类(ICD-9或ICD-10代码)诊断为CAUTI的患者;

(2)对于多次入住ICU的患者,仅考虑首次ICU入院日期;

(3)患者年龄为18岁或以上。

缺失值超过30%的患者被排除。最终,545名患者被纳入本研究。

数据提取、准备和定义

预测结果是ICU住院期间的死亡概率。基于先前研究以及专家意见,从MIMIC数据库中提取了基线人口统计学变量、合并症、生命体征、住院时间、严重程度评分和实验室数据,并使用SQL(结构化查询语言)编程实现。除住院时间外,生命体征在每次ICU入院后的前24小时内收集,而其他变量在入院时测量。为避免过拟合,使用最小绝对收缩和选择算子(LASSO)方法进行变量选择和筛选,并通过10折交叉验证选择最佳正则化参数λ。

缺失数据处理

MIMIC-IV数据库中经常出现缺失数据。然而,如果在分析过程中忽略这些缺失值,结果可能会出现偏差。因此,我们使用链式方程多重插补(MICE)处理缺失值,插补次数设置为5次。每个选定变量的缺失值比例均低于30%。

机器学习可解释工具

通过SHAP方法解释预测模型,这是一种综合方法,能够准确评估每个特征对最终预测结果的贡献和影响。SHAP分析基于Python 3.8的SHAP 0.44.0库实现。SHAP值指示每个预测变量对目标变量的影响程度,无论是正向还是负向。此外,每个数据点可以通过其特定的SHAP值集来理解。

统计分析

使用DecisionLinnc1.0软件进行数据分析,该平台集成了多种编程语言环境,并通过可视化界面实现数据处理、数据分析和机器学习。分类变量以总量和百分比表示,并使用卡方检验或Fisher精确概率法比较不同组间的差异。连续变量以中位数和四分位距(IQR)表示,并使用Wilcoxon秩和检验进行两组间比较。

使用四种机器学习模型——XGBoost、决策树(DT)、逻辑回归(LR)和随机森林(RF)——构建预测模型。通过受试者工作特征曲线下面积(AUC)评估每个模型的预测性能。此外,还计算了准确率、精确率和F1分数。此外,为了通过量化不同阈值概率下的净收益来评估模型在决策中的实用性,进行了决策曲线分析(DCA)。

结果

患者特征

本研究从MIMIC-IV数据库中共1344名CAUTI患者中纳入545名成年患者。患者筛选过程的描述见图1。

表1展示了符合纳入标准的545名患者的基线特征,分为ICU存活组和死亡组。ICU诊断为CAUTI的患者死亡率为7.89%(43/545)。这些患者中,女性261名(47.89%),男性284名(52.11%),中位年龄为74岁(21-99岁),年龄差异不显著(P = 0.803)。在住院时间方面,存活者的中位住院时间为11.94天,死亡者为15.86天(P = 0.117),ICU住院时间无显著差异(P = 0.065)。疾病严重程度评分显示,死亡者的SOFA评分、APSIII评分、APSII评分、OASIS评分和休克指数均显著高于存活者(P < 0.05)。死亡者的机械通气持续时间显著更长(P = 0.004),心率、呼吸频率和血氧饱和度等生命体征显示显著差异。在实验室指标中,死亡者的乳酸、PH值、国际标准化比值(INR)和肌酐显著较差(P < 0.05)。在并发症方面,死亡者的急性肾衰竭(AKI)和恶性肿瘤发生率显著较高。在药物使用方面,死亡者使用镇静剂、镇痛剂和血管活性药物的比例显著高于存活者(P < 0.05)。使用LASSO正则化方法从训练数据集中选择了13个潜在预测因子,这些因素用于模型开发。

模型构建与评估

将数据集随机分为两部分:70%的数据用于训练模型,30%用于验证模型。在训练数据集中,我们构建了四个模型:XGBoost、逻辑回归(LR)、随机森林(RF)和决策树(DT)。测试数据集获得的AUC值如图2和表2所示。在这些模型中,LR显示出最佳的预测性能,AUC为0.871,而DT的泛化能力最低,AUC为0.542。使用决策曲线分析(DCA)在测试数据集上比较了最佳性能模型的净收益与临床决策的替代方法。

我们评估了不同概率阈值下的总体收益。图3中的假设(黑线)假设所有患者都接受了干预。虚线表示没有患者接受任何干预的情况。鉴于研究人群的多样性,基于四种机器学习模型中的任何一种制定治疗策略都比默认治疗所有或不治疗患者更可取。

使用SHAP方法解释模型

采用SHAP算法确定LR模型预测结果中每个预测变量的重要性。变量重要性图按重要性级别从高到低列出了变量排序。

血管活性药物(Vasopressor, VP)的使用被认为在所有预测时期具有最高的预测价值,其次是休克指数(Shock Index)、共存恶性肿瘤(Cancer)和APSIII评分(图4)。

此外,使用SHAP值识别对死亡风险有显著影响的预测变量,并确定它们与目标结果的正向或负向关联。如图5所示,水平位置表示该值的影响是与预测值的增加还是减少相关,而颜色表示特定观察中变量的高低状态。

SHAP热力图

图6展示了死亡和存活患者的热力图。SHAP值提供了对个体患者预测因素的见解,并量化了每个因素对死亡率预测的影响。加粗数字表示概率预测(f(x)),而基础值表示模型在没有任何输入的情况下做出的预测。每个观察的对数几率由函数f(x)表示。左侧显示与死亡风险升高相关的红色特征,而蓝色特征表示与死亡风险降低相关的因素。通过观察箭头的长度可以轻松可视化对预测的影响程度。

讨论

在本研究中,我们利用综合重症监护室(ICU)数据库进行了回顾性队列分析。我们专注于开发和验证四种不同的机器学习算法,这些算法有效预测了诊断为导管相关尿路感染(CAUTI)患者的死亡率。逻辑回归(LR)模型在性能上超过了XGBoost、DT和RF。逻辑回归模型的曲线下面积(AUC)为0.871,在四种模型中显示出更好的预测性能。决策树机器的泛化能力有限,AUC为0.542,预测准确性相对较差。决策树模型性能不佳可能与过拟合有关,其复杂的分支结构在小样本中泛化能力有限。随机森林和XGBoost由于有效事件数不足无法稳定其大参数空间,容易出现过拟合和校准漂移。逻辑回归的优越性能可能源于CAUTI死亡率预测的线性可分离性及其在小样本中对过拟合的抵抗能力。为了在保持逻辑回归模型性能的同时确保其可解释性,我们采用SHAP方法进行解释。这将增强医疗专业人员对模型决策过程的理解,并促进预测结果的实际应用。据观察,在此范围内,逻辑回归显示出优越性能。在重症监护研究领域,逻辑回归因其在预测患者住院死亡率方面的应用而广受欢迎,从而可能帮助医疗专业人员做出明智决策。

评估早期死亡率预测在临床实践中的优势至关重要。本研究从MIMIC-IV数据库诊断的1344名CAUTI患者中纳入545名成年患者。重症监护室(ICU)中CAUTI患者的死亡率为7.89%(43/545)。我们利用SHAP解释LR模型,并识别出与CAUTI患者院内死亡率相关的关键因素。休克指数、血管活性药物使用、共存恶性肿瘤和APSIII评分被确定为具有高预测意义的变量。SHAP风险阈值有助于早期识别高风险患者,建议将其整合到ICU电子病历的预警系统中。

然而,相对较少的研究调查导管相关尿路感染(CAUTI)患者死亡的风险因素。高休克指数表明可能存在血流动力学不稳定,并与危重患者死亡率增加相关。这种不稳定性反映了身体无法维持足够的器官灌注和氧合,从而损害其功能并导致多器官衰竭,特别是在CAUTI等感染背景下。血管活性药物的使用通常表明患者存在严重炎症和显著心血管损伤,并可能导致CAUTI死亡率增加。恶性肿瘤患者通常由于疾病本身或化疗和放疗等治疗选择而免疫系统受损,使他们更容易受到感染,包括CAUTI。研究表明,癌症患者面临CAUTI的高发病率,这与这些感染相关的死亡风险增加有关,肿瘤的代谢活性和发生中性粒细胞减少症的潜力进一步复杂化了此类患者的治疗,并增加了严重并发症的风险。恶性肿瘤是CAUTI患者28天死亡率的独立风险因素。APSIII是一个基于各种生理参数评估疾病严重程度的评分系统;较高分数与危重患者死亡风险增加相关,可用作临床结局的预测因子。未来可以开发床边临床决策支持系统(CDSS)工具,通过实时输入生理参数生成死亡风险评分。然而,由于缺乏外部验证队列,需要进一步研究探索这种研究方法的适用性。

局限性

我们研究的优势在于使用了从MIMIC数据库获得的大样本量,统计结果相当有说服力。然而,本研究存在几个局限性。首先,由于我们的数据来自公开可访问的数据库,一些变量不完整。其次,所有数据均来自MIMIC数据库中的ICU患者,这引发了我们模型在其他人群中的适用性问题。第三,我们的死亡率预测模型依赖于每次ICU入院前24小时内的信息;这可能忽略了可能改变预后的后续事件,并在一定程度上引入混淆因素。最后,由于缺乏外部验证队列,开发的LR模型在临床实践中的有效性可能有限。

结论

本研究为开发ICU死亡风险实时预测工具提供了方法学基础,并展示了人工智能在准确预测重症监护室(ICU)患者导管相关尿路感染(CAUTI)和死亡率方面的效用。我们创建了一个可解释的逻辑回归预测模型,该模型在评估CAUTI患者死亡风险方面表现最佳。此外,这种可解释的机器学习方法能够有效识别与CAUTI患者相关的风险因素,并将帮助医疗提供者识别具有高死亡风险的CAUTI患者,使他们能够采取及时有效的治疗措施。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号