基于机器学习的预测方法，用于判断重症监护病房（ICU）中肺炎患者是否需要早期进行侵入性机械通气：方法开发与外部验证

《International Journal of Medical Informatics》：Machine learning-based prediction of early invasive mechanical ventilation in ICU patients with pneumonia: Development and external validation

【字体：大中小】 时间：2026年06月12日 来源：International Journal of Medical Informatics 4.1

编辑推荐：

　　卢彦平|陈浩杰|李明翰|梁华珍|吕华良南方医科大学第一临床医学院，中国广东省广州市510515摘要背景肺炎是重症监护病房（ICU）中常见的危重疾病，其中一部分患者会迅速发展为需要侵入性机械通气（IMV）的呼吸衰竭。目前的决策通常依赖于零散的临床指标，这凸显了需要集成化、数据驱动的

卢彦平|陈浩杰|李明翰|梁华珍|吕华良

南方医科大学第一临床医学院，中国广东省广州市510515

摘要

背景

肺炎是重症监护病房（ICU）中常见的危重疾病，其中一部分患者会迅速发展为需要侵入性机械通气（IMV）的呼吸衰竭。目前的决策通常依赖于零散的临床指标，这凸显了需要集成化、数据驱动的工具来进行早期风险评估的必要性。

方法

我们使用Medical Information Mart for Intensive Care Ⅳ（MIMIC-Ⅳ）数据库进行了回顾性队列研究。该队列被随机分为训练集（80%）和测试集（20%）。通过多步特征选择确定了ICU入院时的候选预测因子。使用5折交叉验证和超参数调整训练了八个机器学习模型。模型性能从区分度、校准度和临床实用性方面进行了评估。表现最佳的模型在茂名人民医院的独立队列中进行了外部验证。此外，还开发了一个基于网络的计算器，以促进潜在的临床应用和个性化风险评估。

结果

开发队列包括5,608名患者，其中856名（15.3%）在24小时内需要IMV。最终模型保留了七个预测因子：年龄、氧流量、FiO₂、pH值、PaO₂和血小板计数。LightGBM在内部测试集中的表现最佳（AUC = 0.799），在外部验证队列中的AUC为0.702（n = 155）。校准显示了可接受的一致性，决策曲线分析证明了其临床益处。风险分层进一步识别出具有逐渐增加的IMV发病率的临床不同患者群体。SHAP分析通过识别与IMV风险相关的关键预测因子，增强了模型的可解释性。

结论

本研究开发并外部验证了一个机器学习模型和在线计算器，用于预测ICU肺炎患者早期是否需要IMV。该模型提供了一种可解释的、数据驱动的方法来进行早期风险分层，可作为辅助临床决策的工具。需要进行多中心前瞻性研究以确认其临床实用性。

引言

肺炎是重症监护病房（ICU）中最常见的危重疾病之一，也是急性呼吸衰竭和需要IMV的主要原因[1]。与普通病房的患者相比，ICU中的肺炎患者常伴有严重的低氧血症、多器官功能障碍、疾病进展迅速以及死亡风险显著增加[2]。尽管抗感染治疗和器官支持技术有所进步，但肺炎相关的呼吸衰竭仍然是重症监护中的主要挑战[3]。

急性呼吸衰竭是ICU肺炎患者中最常见且致命的并发症之一[2]，而IMV是一种关键的维持生命的支持性治疗。然而，对重症患者进行气管插管仍然是一个高风险的程序。因此，决定是否以及何时开始IMV是一个具有挑战性的临床决策[4]、[5]、[6]。过早插管可能会增加与呼吸机相关的并发症和医疗资源的使用，而延迟插管可能导致不可逆的缺氧损伤、循环衰竭甚至死亡[7]。特别是在肺炎患者中，疾病进展通常很快且时间依赖性强，临床恶化可能在几小时内发生[8]。目前的IMV决策主要依赖于单一或经验性参数，如动脉血气指标、呼吸频率和意识水平[9]。缺乏对多维临床信息的系统整合，目前还没有客观的早期IMV风险预测工具。

传统的严重程度评分，包括APACHE II、SAPS II和SOFA，被广泛用于评估疾病严重程度和预后，但它们并非专门为早期IMV决策设计的，在不同人群中的表现也各不相同[10]、[11]、[12]。近年来，由于机器学习（ML）方法在建模复杂非线性关系和整合高维数据方面的优势，越来越多地应用于重症监护医学中的风险预测[13]。然而，大多数研究集中在死亡率预测或一般ICU人群的插管上[14]、[15]、[16]，针对ICU肺炎患者的早期IMV的模型较少，尤其是经过外部验证的模型。

MIMIC-Ⅳ数据库为开发稳健的预测模型提供了大量结构化数据[17]，可解释性方法的进步提高了这些模型的临床适用性[18]。因此，本研究开发并比较了八个ML模型，以预测ICU入院后24小时内是否需要IMV。表现最佳的模型进行了外部验证，并开发了一个在线风险评估工具，以促进早期风险分层和辅助临床决策。

章节摘录

研究设计和人群

这项回顾性队列研究旨在开发并外部验证一个预测模型，用于预测ICU肺炎患者入院后24小时内是否需要IMV。开发队列来自MIMIC-Ⅳ（版本3.1），这是一个包含2008年至2022年间美国波士顿Beth Israel Deaconess医疗中心ICU患者去标识化临床数据的公开数据库。作者完成了所需的协作机构培训计划（CITI）并获得

基线特征

患者选择的示意图见图1。最初从MIMIC-IV数据库中识别出13,393名肺炎患者，其中5,608名符合纳入标准并被纳入开发队列。在这些患者中，856名（15.3%）在ICU入院后24小时内需要IMV。对于外部验证，从茂名人民医院筛选了561名患者，最终有155名被纳入。

开发队列的基线特征

主要发现

在这项研究中，我们开发并外部验证了一个机器学习模型，用于预测ICU肺炎患者入院后24小时内是否需要IMV。选择24小时的预测时间范围是为了反映ICU实践中早期呼吸恶化和气道管理的临床相关窗口。在多个候选模型中，LightGBM表现出最佳的整体性能，在内部测试集中实现了可接受的区分度和校准度

结论

本研究开发并外部验证了一个基于LightGBM的机器学习模型，用于预测ICU肺炎患者入院后24小时内是否需要IMV。该模型使用常规可用的入院变量，表现出可接受的预测性能，有助于早期风险分层和数据驱动的临床决策。进一步开发了一个基于网络的计算器，以促进个性化风险评估。需要进一步的大规模

CRediT作者贡献声明

卢彦平：撰写——原始草稿、软件、方法学、正式分析、数据管理、概念化。陈浩杰：验证、调查、数据管理。李明翰：验证、正式分析、数据管理。梁华珍：验证、资源管理、调查。吕华良：撰写——审阅与编辑、监督、方法学。

资金

本研究得到了茂名市科技专项资金项目（项目编号2024kjcxLX049）的支持。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。

摘要

背景

方法

结果

结论

引言