基于SHAP可解释性机器学习的脓毒症相关急性肾损伤院内死亡率预测:一项多中心研究
《Clinical Kidney Journal》:Prediction of Hospital Mortality in Sepsis-Associated Acute Kidney Injury using a Machine-Learning Approach: A Multi-Center Study Using SHAP Interpretability Analysis
【字体:
大
中
小
】
时间:2025年11月30日
来源:Clinical Kidney Journal 4.6
编辑推荐:
本研究针对脓毒症相关急性肾损伤(S-AKI)死亡率预测精度不足的临床难题,开发了基于梯度提升机(GBM)的可解释预测模型。研究利用五个国际重症数据库共27,485例患者数据,通过Boruta算法筛选21个共识特征,模型在外部验证中AUC达0.731-0.778。SHAP分析揭示SAPS II>60和SOFA>15为关键风险阈值,决策曲线显示模型在4-82%概率阈值均具临床效用,为S-AKI个体化风险评估提供了可靠工具。
在重症监护病房中,脓毒症相关急性肾损伤(S-AKI)是一种致命性并发症,其死亡率高达25%以上,给临床诊疗带来巨大挑战。传统评分系统如APACHE II和SAPS II虽然广泛应用于临床,但预测精度有限,且缺乏对个体化决策的支持能力。更为关键的是,现有预测模型多基于单中心数据,缺乏跨医疗机构和不同人群的验证,其泛化能力存疑。同时,大多数机器学习模型如同"黑箱",医生难以理解模型做出特定预测的依据,这严重阻碍了此类先进技术在临床实践中的推广应用。
发表在《Clinical Kidney Journal》上的这项研究,旨在突破这些局限。研究团队通过整合五个国际大型重症数据库(MIMIC-IV、MIMIC-III-CareVue、eICU、NWICU和SICdb),共纳入27,485例S-AKI患者,开展了一项大规模、多中心的回顾性队列研究。
研究采用了一系列先进的技术方法。特征选择使用Boruta算法在三个主要数据库(MIMIC-IV、MIMIC-III和eICU)中识别共识特征;模型构建比较了11种机器学习算法,包括梯度提升机(GBM)、XGBoost、随机森林等;模型性能通过ROC曲线分析、校准曲线和决策曲线分析(DCA)进行全面评估;模型可解释性采用SHAP(SHapley Additive exPlanations)分析,提供全局和个体两个层面的解释。
研究最终纳入27,485例S-AKI患者,总体院内死亡率为27.5%。不同数据库间患者特征存在显著异质性,如eICU患者相对年轻(中位年龄67.0岁),而MIMIC-III-CareVue患者年龄较大(72.3岁)。疾病严重程度评分也呈现差异,eICU患者的SOFA评分最高(中位数8.0),而MIMIC-III-CareVue患者的SAPS II评分和Charlson合并症指数最高。
Boruta算法在三个数据库中共同确定了21个对S-AKI死亡率预测至关重要的特征。这些特征包括人口统计学特征(年龄)、疾病严重程度评分(SAPS II、SOFA、OASIS、Charlson合并症指数)、生命体征(平均动脉压、收缩压、舒张压、体温、呼吸频率、血氧饱和度)以及关键实验室参数(碳酸氢盐、肌酐、血尿素氮、钠、氯、血红蛋白、血小板计数、血细胞比容、红细胞计数、白细胞计数)。其中,SAPS II评分在所有数据库中均位列最重要的预测因子。
在比较的11种机器学习算法中,梯度提升机(GBM)表现最优。在MIMIC-IV训练集中,GBM的AUC为0.770,内部验证集为0.731。在四个外部验证集中,GBM表现出稳健的性能:NWICU(AUC 0.769)、SICdb(AUC 0.778)、MIMIC-III(AUC 0.732)和eICU(AUC 0.751)。模型校准良好,预测概率与观察到的死亡率高度一致。使用28天死亡率作为终点时,GBM性能进一步提升(MIMIC-IV中AUC 0.818,MIMIC-III中AUC 0.797)。
决策曲线分析显示,GBM模型在4%到82%的广泛概率阈值范围内均显示出临床净获益。在不同数据集中,模型均优于"治疗所有"或"不治疗"的默认策略,峰值获益出现在5-25%的风险范围内,这与临床决策中最具挑战性的中等风险患者群体相对应。
SHAP分析揭示了模型的决策机制。SAPS II评分是最重要的预测因子(平均|SHAP值| 0.062-0.066),其次是SOFA评分(0.030-0.034)和呼吸频率(0.023-0.028)。SHAP依赖图揭示了特征与死亡率风险之间的非线性关系:SAPS II评分>60和SOFA评分>15时死亡风险显著增加;呼吸频率呈现U型关系,过慢(<10次/分)或过快(>30次/分)均增加风险;血氯水平与死亡率呈负相关,低氯血症(<100 mmol/L)风险更高。
研究还通过瀑布图对比了高风险和低风险患者的特征贡献。一名高风险患者(预测死亡率67.4%)的主要风险因素包括极高的SAPS II评分(101分)、高SOFA评分(18分)和低血细胞比容(52.7%)。而低风险患者(预测死亡率约45%)则受益于较低的SAPS II评分(25分)、正常呼吸频率(14次/分)和较低的SOFA评分(4分)。
这项研究的意义在于它解决了S-AKI死亡率预测中的多个关键问题。首先,通过多中心大样本验证,证明了机器学习模型在不同医疗环境下的稳健泛化能力。其次,通过SHAP可解释性分析,使复杂的机器学习预测变得透明可理解,有助于临床医生接受和信任。第三,确定的风险阈值(如SAPS II>60)为临床识别高危患者提供了具体标准。最后,模型在广泛概率范围内的临床效用表明它可用于不同风险层次患者的分类管理。
研究的局限性包括其回顾性设计、主要基于发达国家数据以及使用静态(入院24小时内)预测变量。未来研究可探索动态预测模型、整合新型生物标志物,并与深度学习模型进行对比。
总体而言,这项研究为S-AKI的精准医疗提供了有力工具,将有助于临床医生进行个体化风险评估、资源优化配置和早期干预决策,最终可能改善这一高危患者群体的临床结局。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号