基于MIMIC-IV 3.1和eICU-CRD 2.0数据，开发一种可解释的机器学习模型用于预测冠状动脉旁路移植术患者的术后ICU住院时间，并对其外部有效性进行验证

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Medical Informatics and Decision Making》：Development and external validation of an interpretable machine learning model for predicting prolonged postoperative ICU length of stay in coronary artery bypass grafting patients using MIMIC-IV 3.1 and eICU-CRD 2.0

【字体：大中小】 时间：2026年06月29日 来源：BMC Medical Informatics and Decision Making 5.5

编辑推荐：

　　摘要背景冠状动脉旁路移植术（CABG）术后患者在重症监护室（ICU）的住院时间过长会增加资源消耗，而在首次考虑延长监测时间至72小时之后的24小时ICU评估时，仍难以准确预测这一情况。为此，我们开发了一种可解释的机器学习决策支持计算工具，并对其进行了外部验证，以便在該评估时刻使用

摘要

背景

冠状动脉旁路移植术（CABG）术后患者在重症监护室（ICU）的住院时间过长会增加资源消耗，而在首次考虑延长监测时间至72小时之后的24小时ICU评估时，仍难以准确预测这一情况。为此，我们开发了一种可解释的机器学习决策支持计算工具，并对其进行了外部验证，以便在該评估时刻使用。

方法

研究数据来自MIMIC-IV 3.1数据库（n?=?6,919；其中7:3的比例用于模型开发），以及eICU-CRD 2.0数据库（n?=?5,972，用于外部验证）。研究结果以ICU住院时间超过3天作为判定标准。通过Elastic Net加上Boruta算法，从患者入院后的24小时内收集的8项指标中筛选出关键特征：24小时液体摄入量、查尔森合并症指数（CCI）、序贯器官功能衰竭评估评分（SOFA）、简化急性生理评分II（SAPS-II）、格拉斯哥昏迷评分（GCS）、升压药使用情况、充血性心力衰竭以及心房颤动。随后通过10折交叉验证结合Bonferroni和Benjamini–Hochberg校正方法，比较了9种不同的机器学习算法。校准指标包括霍斯默-莱梅肖检验、综合校准指数（ICI）、预期与观察值比率、截距以及斜率（详细方法见原文）。SHapley加法解释方法则用于分析每个患者各项特征的影响程度。

结果

最终选定的模型为CatBoost。在MIMIC-IV内部测试集上，该模型的受试者工作特征曲线下面积为0.7739（95%置信区间为0.7379–0.8099），霍斯默-莱梅肖检验的p值为0.224，模型校准斜率为0.973。在eICU-CRD外部数据集中，AUC值为0.6452（95%置信区间为0.6311–0.6602），校准斜率为0.998，ICI值为0.023。当以0.30作为阈值时，该模型的灵敏度为0.55，特异性为0.65，阳性预测值为0.40，阴性预测值为0.77。决策曲线分析显示，在t值为0.20–0.40的范围内，该模型的应用相比“全部治疗”和“不治疗”两种方案具有明显的优势。通过SHAP分析，影响最大的前三项特征分别是24小时液体摄入量、查尔森合并症指数以及心房颤动。

结论

该模型可在CABG术后24小时的ICU评估时刻为医生提供决策支持，虽然其区分能力有限，但模型输出的概率值经过良好校准。此外，这款在线计算工具还能通过SHAP方法让医护人员清晰了解每项特征对决策的影响。在实际临床应用之前，还需要进行进一步的前瞻性验证。

背景

冠状动脉旁路移植术（CABG）术后患者在重症监护室（ICU）的住院时间过长会增加资源消耗，而在首次考虑延长监测时间至72小时之后的24小时ICU评估时，仍难以准确预测这一情况。为此，我们开发了一种可解释的机器学习决策支持计算工具，并对其进行了外部验证，以便在該评估时刻使用。

方法

研究数据来自MIMIC-IV 3.1数据库（n?=?6,919；其中7:3的比例用于模型开发），以及eICU-CRD 2.0数据库（n?=?5,972，用于外部验证）。研究结果以ICU住院时间超过3天作为判定标准。通过Elastic Net加上Boruta算法，从患者入院后的24小时内收集的8项指标中筛选出关键特征：24小时液体摄入量、查尔森合并症指数（CCI）、序贯器官功能衰竭评估评分（SOFA）、简化急性生理评分II（SAPS-II）、格拉斯哥昏迷评分（GCS）、升压药使用情况、充血性心力衰竭以及心房颤动。随后通过10折交叉验证结合Bonferroni和Benjamini–Hochberg校正方法，比较了9种不同的机器学习算法。校准指标包括霍斯默-莱梅肖检验、综合校准指数（ICI）、预期与观察值比率、截距以及斜率（详细方法见原文）。SHapley加法解释方法则用于分析每个患者各项特征的影响程度。

结果

最终选定的模型为CatBoost。在MIMIC-IV内部测试集上，该模型的受试者工作特征曲线下面积为0.7739（95%置信区间为0.7379–0.8099），霍斯默-莱梅肖检验的p值为0.224，模型校准斜率为0.973。在eICU-CRD外部数据集中，AUC值为0.6452（95%置信区间为0.6311–0.6602），校准斜率为0.998，ICI值为0.023。当以0.30作为阈值时，该模型的灵敏度为0.55，特异性为0.65，阳性预测值为0.40，阴性预测值为0.77。决策曲线分析显示，在t值为0.20–0.40的范围内，该模型的应用相比“全部治疗”和“不治疗”两种方案具有明显的优势。通过SHAP分析，影响最大的前三项特征分别是24小时液体摄入量、查尔森合并症指数以及心房颤动。

结论

该模型可在CABG术后24小时的ICU评估时刻为医生提供决策支持，虽然其区分能力有限，但模型输出的概率值经过良好校准。此外，这款在线计算工具还能通过SHAP方法让医护人员清晰了解每项特征对决策的影响。在实际临床应用之前，还需要进行进一步的前瞻性验证。

联系信箱：

粤ICP备09063491号

摘要

背景

方法

结果

结论

背景

方法

结果

结论

热点排行