
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于MIMIC-IV数据库的机器学习模型预测酒精性肝硬化患者28天全因死亡率
【字体: 大 中 小 】 时间:2025年06月12日 来源:Clinical and Experimental Medicine 3.2
编辑推荐:
这篇研究基于MIMIC-IV数据库,开发并验证了预测酒精性肝硬化(AC)患者28天全因死亡率的机器学习模型(包括决策树、随机森林、XGBoost等),其AUC值(0.85-0.91)显著优于传统MELD评分(0.77)。通过SHAP分析揭示了年龄、SOFA评分、ASPIII评分等14项关键预测因子,为临床早期风险分层提供了高精度工具。
Abstract
研究团队利用MIMIC-IV数据库中2134例酒精性肝硬化(AC)患者数据,开发了预测28天全因死亡率的机器学习模型。通过决策树(DT)、随机森林(RF)、极端梯度提升(XGBoost)等算法构建的模型,在训练组和验证组中均表现出优异性能(AUC 0.85-0.91),显著超越传统MELD评分的0.77。SHAP分析揭示了年龄、SOFA评分、总胆红素(Tbil)等14项核心预测因子,为临床决策提供了新工具。
Introduction
酒精性肝硬化(AC)是全球肝病相关死亡的主因之一,其预后受年龄、并发症等多因素影响。尽管MELD评分广泛用于肝硬化预后评估,但其对短期死亡率的预测存在局限。MIMIC-IV数据库提供的丰富临床数据为机器学习模型开发创造了条件。本研究旨在探索机器学习算法在AC患者28天死亡率预测中的优势。
Methods
数据来自MIMIC-IV v3.1数据库,纳入标准为ICD-9/10诊断的AC患者,排除ICU停留<24小时者。采用LASSO回归筛选变量后,构建DT、RF、XGBoost等模型,70%数据训练、30%验证。性能通过AUC、校准曲线和决策曲线分析(DCA)评估,SHAP值解析变量贡献。
Result
队列中29.2%(624/2134)患者28天内死亡。LASSO回归筛选出14项预测因子:年龄、体温、氯化物、乳酸、INR、Tbil、APTT及SOFA、ASPIII等评分。XGBoost和SVM模型表现最佳(验证组AUC 0.84-0.87),DT模型最差(AUC 0.74)。SHAP分析显示ASPIII评分(急性生理学评分III)影响最大,其高值与死亡风险强相关;而体温和氯化物升高则降低风险。
Discussion
相比传统MELD评分,机器学习模型整合了危重症评分系统(如ASPIII、LODS)和生化指标,显著提升预测精度。SHAP分析赋予模型可解释性:ASPIII评分每增加1单位,死亡风险提升12%(非线性关系)。但研究存在局限性:数据仅来自MIMIC-IV,且模型复杂度可能影响临床推广。未来需外部验证并探索长期预后预测。
(注:全文严格依据原文数据,未添加非文献结论;专业术语如INR国际标准化比值、APTT活化部分凝血活酶时间等均保留原文格式;上标/sub标签已按规范处理)
生物通微信公众号
知名企业招聘