基于机器学习的脓毒性休克早期预测:模型开发、外部验证与SHAP可解释性分析
《International Journal of Medical Microbiology》:Early prediction of septic shock in ICU patients using machine learning: development, external validation, and explainability with SHAP
【字体:
大
中
小
】
时间:2025年11月03日
来源:International Journal of Medical Microbiology 3.6
编辑推荐:
本研究针对ICU脓毒症患者向脓毒性休克进展的早期预测难题,开发了六种机器学习模型。通过MIMIC-IV和eICU-CRD多中心数据验证,随机森林(RF)模型表现最佳(AUC=0.785),SHAP分析揭示SOFA评分、心率等关键预测因子,为临床决策提供透明化工具。
在重症监护室(ICU)中,脓毒症(Sepsis)及其更严重的阶段——脓毒性休克(Septic Shock),一直是威胁患者生命的主要杀手。脓毒症是机体对感染反应失调导致的危及生命的器官功能障碍,而脓毒性休克则伴随着严重的循环和代谢异常,死亡率高达30-40%,几乎是单纯脓毒症患者死亡率的两倍。全球每年有近4900万脓毒症病例,导致约110万人死亡,给医疗卫生系统带来沉重负担。尽管医学在不断进步,但脓毒症患者向脓毒性休克发展的早期识别仍然充满挑战。这主要源于患者临床表现的异质性、真实世界ICU数据的不完整性,以及脓毒症动态发展的病理生理过程。传统的评分系统,如快速序贯器官衰竭评估(qSOFA),其预测性能有限(AUC约0.68),难以满足临床对高精度、早期预警的需求。
近年来,人工智能(AI)的分支——机器学习(Machine Learning, ML)在医疗领域展现出巨大潜力。它能够从复杂、高维度的临床数据中挖掘出有价值的信息,辅助临床决策。然而,大多数基于大型ICU数据库(如MIMIC-IV和eICU-CRD)的研究聚焦于死亡率预测,而非脓毒症向脓毒性休克的进展预测。此外,这些研究往往缺乏多中心外部验证,且模型通常被视为“黑箱”,缺乏可解释性,限制了其在临床实践中的应用。为了填补这一关键空白,江南大学无锡医学院公共卫生研究中心全球健康研究分部的Haoyun Zhou、Feng Li和Xiaoxue Liu研究团队在《International Journal of Medical Microbiology》上发表了一项研究,旨在开发并外部验证能够早期预测ICU脓毒症患者进展为脓毒性休克的机器学习模型,并利用SHapley Additive exPlanations (SHAP) 方法增强模型的可解释性,为临床医生提供透明、可信的决策支持。
为了开展这项研究,研究人员主要应用了几个关键技术方法。首先,在数据来源方面,他们利用了两个大型公开的重症监护数据库:MIMIC-IV(来自贝斯以色列女执事医疗中心,2008-2019年数据)和eICU-CRD(来自美国多家机构的多中心数据)。研究纳入了共计11,383名符合脓毒症-3(Sepsis-3)诊断标准的ICU患者,其中MIMIC-IV的5,561名患者作为训练集,eICU-CRD的5,822名患者作为外部验证集。其次,在特征工程与模型构建上,他们采用LASSO(Least Absolute Shrinkage and Selection Operator)回归进行变量筛选,以降低模型复杂性并保留最具预测力的特征。随后,他们训练并比较了六种经典的机器学习算法,包括逻辑回归(Logistic Regression, LR)、随机森林(Random Forest, RF)、极端梯度提升(eXtreme Gradient Boosting, XGBoost)、支持向量机(Support Vector Machine, SVM)、轻量级梯度提升机(Light Gradient Boosting Machine, LGBM)和朴素贝叶斯(Na?ve Bayes, NB)。最后,在模型评估与解释方面,他们使用接收者操作特征曲线下面积(AUC)、F1分数、平衡准确度(Balanced Accuracy)等指标全面评估模型性能,并采用SHAP方法对最佳模型进行可解释性分析,量化每个特征对预测结果的贡献度。
纳入研究的患者中,训练队列(MIMIC-IV)有2,259人(40.6%)发展为脓毒性休克,验证队列(eICU-CRD)有1,212人(20.8%)发展为脓毒性休克。统计分析显示,发生脓毒性休克的患者在基线时具有更重的病情。他们的序贯器官衰竭评估(Sequential Organ Failure Assessment, SOFA)评分、简化急性生理学评分II(Simplified Acute Physiology Score II, SAPS II)和牛津急性疾病严重程度评分(Oxford Acute Severity of Illness Score, OASIS)显著更高,而格拉斯哥昏迷评分(Glasgow Coma Scale, GCS)则更低。同时,休克组患者更常合并急性肾损伤(Acute Kidney Injury, AKI)、充血性心力衰竭(Congestive Heart Failure)和肝脏疾病等并发症,其心率、呼吸频率、肌酐(Creatinine)、血尿素氮(Blood Urea Nitrogen, BUN)等生理和实验室指标也表现出更严重的紊乱。这些差异在训练集和验证集中均高度一致,表明两个队列具有可比性,适合用于模型的开发和验证。
通过LASSO回归进行变量筛选,最终保留了26个对预测脓毒性休克有重要贡献的特征。这些特征涵盖了疾病严重程度评分、生理指标、实验室检查和并发症等多个方面。关键预测因子包括SOFA评分、轻度肝病、血清钾(Potassium)、糖尿病、有创通气、酒精滥用、充血性心力衰竭和体温等。此外,肌酐、查尔森合并症指数(Charlson Comorbidity Index)、AKI评分、高血压、OASIS评分、BUN、体重、年龄、呼吸频率、心率、血清钠(Sodium)、SAPS II评分、GCS评分、性别和AKI状态也被选入模型。这一筛选过程确保了后续机器学习模型聚焦于最相关的临床信息。
在外部验证集(eICU-CRD)上,六种机器学习模型均表现出一定的预测能力,但性能存在差异。随机森林(RF)模型综合表现最佳,其曲线下面积(AUC)达到0.785(95%置信区间CI: 0.770-0.800),平衡准确度为0.717,F1分数为0.511。这意味着RF模型在识别脓毒性休克高危患者方面具有良好的判别能力和临床实用性。极端梯度提升(XGBoost, AUC=0.782)和支持向量机(SVM, AUC=0.780)模型紧随其后。逻辑回归(LR)和朴素贝叶斯(NB)模型虽然灵敏度较高(分别为0.831和0.748),但F1分数相对较低,表明其精确度有所不足。轻量级梯度提升机(LGBM)模型在本研究中的AUC相对最低,为0.742。进一步的分析显示,RF模型的校准曲线最接近理想状态,说明其预测概率与实际发生风险吻合良好。决策曲线分析(Decision Curve Analysis, DCA)也证实,RF模型在广泛的决策阈值范围内能提供最大的临床净获益,支持其在实际应用中的价值。
为了深入理解RF模型做出决策的依据,研究人员使用了SHAP方法进行可解释性分析。SHAP值量化了每个特征对模型预测个体患者发生脓毒性休克风险的贡献大小和方向(正向或负向影响)。分析结果显示,SOFA评分是影响模型预测最重要的因素(平均绝对SHAP值 |SHAP| = 0.0846),这与其作为评估器官功能障碍核心指标的地位相符。其次是心率(|SHAP| = 0.0434)、肌酐(|SHAP| = 0.0383)、SAPS II评分(|SHAP| = 0.0372)和OASIS评分(|SHAP| = 0.0281)。年龄、血清钾、BUN和体温等也具有中等程度的贡献(|SHAP|值在0.020-0.025之间)。SHAP摘要图(蜜蜂群图)直观地展示了这些关系:例如,较高的SOFA评分、较快的心率、较高的肌酐水平通常与更高的脓毒性休克风险相关(SHAP值为正),而较低的数值则与风险降低相关(SHAP值为负)。这种患者级别的解释能力,极大地增强了临床医生对模型的信任,有助于他们理解模型为何将某位患者判定为高风险,并据此关注相关的临床指标。
本研究通过系统性的开发与验证,成功构建了一个基于常规ICU数据的机器学习模型,能够有效预测脓毒症患者进展为脓毒性休克的风险。其中,随机森林(RF)模型表现出最优的综合性能。研究的结论和讨论部分强调了几个关键点。首先,该模型的优势在于其强大的泛化能力,它不仅在单一中心数据(MIMIC-IV)上表现良好,更重要的是在来自不同医疗机构的多中心数据(eICU-CRD)上得到了有效验证,这表明模型能够适应不同临床环境下的数据差异,具备较高的临床应用潜力。其次,模型所使用的特征均为ICU常规收集的变量,如生命体征、实验室结果和通用疾病严重程度评分(SOFA、SAPS II、OASIS等),这使得模型易于整合到现有的电子健康记录(Electronic Health Record, EHR)系统中,实现自动化、实时的风险预警,克服了传统评分系统需要人工计算、时效性差的缺点。
最重要的是,研究通过SHAP分析实现了模型的可解释性,成功“打开”了机器学习模型的“黑箱”。SHAP分析不仅确认了SOFA评分、心率、肌酐等临床公认的重要预测因子,其定量化的贡献度排序和个体化解释也与基线统计分析和LASSO特征选择的结果相互印证,增强了整个研究框架的临床合理性和可靠性。这为临床医生提供了透明化的决策依据,使他们不仅能获得预测结果,还能理解结果背后的驱动因素,从而有针对性地采取干预措施。
当然,研究也存在一些局限性,例如回顾性数据固有的偏倚、部分重要指标(如乳酸动态变化、炎症标志物)的缺失等。未来研究可探索融入更多动态数据流或开发更先进的算法以进一步提升性能。尽管如此,这项研究为脓毒性休克的早期预警提供了一种准确、可解释且易于推广的数据驱动解决方案,有望辅助临床医生进行及时的风险分层和干预,最终改善脓毒症患者的预后。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号