ICU脓毒症患者死亡预测的重要临床因素：一种机器学习方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Smart Health》：Significant clinical factors for mortality prediction in ICU sepsis patients: A machine learning approach

【字体：大中小】 时间：2025年10月10日 来源：Smart Health CS7.7

编辑推荐：

　　本研究通过MIMIC-IV和eICU两个独立数据集，构建并验证了基于LightGBM的脓毒症ICU患者死亡率预测模型。通过序列特征选择法（SFS）从77个临床因素中筛选出25个关键指标，包括生命体征和实验室数据。模型在MIMIC-IV数据集上AUC达0.84，在eICU外部验证中AUC为0.75，优于传统SOFA评分（AUC 0.72）。结果显示生命体征和实验室指标（如血压、心率、乳酸、肌酐）对死亡率预测贡献最大，且模型在资源受限环境下具有可行性。

　　重症监护病房（ICU）中的脓毒症是全球重症监护病房死亡的主要原因之一，早期识别风险因素对于改善患者预后至关重要。然而，脓毒症的复杂性限制了预测模型在临床中的实际应用。为了提高模型的实用性，机器学习（ML）模型必须具备强大的泛化能力，能够在不同ICU环境中保持稳定性能，同时具备可操作性，即模型能够基于常规临床因素进行实施。本研究旨在识别具有显著临床预测价值的因素，开发可用于不同临床环境的可操作模型，以实现脓毒症患者死亡的准确预测。

### 1. 背景

脓毒症是一种由感染引发的全身性炎症反应，可能导致多器官功能障碍和脓毒性休克。由于其进展迅速，常在数小时内导致致命后果，因此，对脓毒症患者死亡的准确预测至关重要。然而，传统的临床评分系统，如SOFA（Sequential Organ Failure Assessment）和APACHE（Acute Physiology and Chronic Health Evaluation），虽然在某些情况下已被验证，但它们通常基于简化的模型，可能无法全面捕捉脓毒症的复杂生理相互作用。此外，这些系统往往依赖于固定变量和线性关系，限制了其在临床实践中的应用。近年来，机器学习技术因其在医疗数据处理和预测方面的潜力而受到广泛关注。然而，现有的研究大多未重点考虑临床因素的选择，特别是在跨机构验证和实际操作性方面存在不足。

### 2. 方法

本研究采用回顾性分析，使用两个大型公开数据集：MIMIC-IV v3.0和eICU v2.0。MIMIC-IV v3.0来自波士顿的Beth Israel Deaconess Medical Center，而eICU v2.0则汇集了多个ICU的数据，涵盖了更广泛的临床场景和实践。研究首先分析了15,100名ICU患者的临床数据用于训练，然后使用8,201名患者进行外部验证。为确保模型的可操作性，研究采用了一种逐步特征选择（Sequential Feature Selection, SFS）方法，将模型的临床因素数量从77个减少到25个，同时保持其预测性能不变。此外，研究通过计算奥德斯比（Odds Ratio, OR）和调整奥德斯比（Adjusted Odds Ratio, AOR）来评估临床因素与死亡率之间的预测关系，并通过DeLong’s测试验证不同特征子集之间的性能差异。

### 3. 结果

研究发现，LightGBM（Light Gradient Boosting Machine）模型在MIMIC-IV v3.0数据集上达到了最高的AUC值（0.84），而在eICU v2.0数据集上为0.75。通过逐步特征选择，模型被简化为仅使用25个临床因素，且在DeLong’s测试中，其AUC值与使用所有77个因素的模型无显著差异（p值为0.507）。这表明，模型在减少因素数量的同时仍能保持高预测性能。研究还发现，生命体征和实验室结果是重要的预测因素，这些因素在临床实践中被广泛监测，且与死亡率存在显著关联。通过OR分析，生命体征的OR值为2.252（95% CI: 2.193–2.313），实验室因素的OR值为1.951（95% CI: 1.903–2.000），表明这些因素在脓毒症死亡预测中具有重要作用。相比之下，人口统计学和格拉斯哥昏迷量表（Glasgow Coma Scale, GCS）的OR值较低，表明它们对死亡率的预测作用较弱。

### 4. 讨论

本研究的成果表明，通过结合生命体征和实验室数据，可以构建一个既高效又实用的机器学习模型，用于预测脓毒症患者的死亡率。模型的AUC值在eICU数据集上达到0.79，显著优于传统的SOFA评分系统（AUC为0.72）。此外，模型在单个患者预测中表现出极低的推理时间，表明其适合实时临床应用。尽管如此，模型的泛化能力仍需在不同的ICU环境中进行进一步验证。由于临床数据的多样性和不同机构之间的差异，模型可能需要进行本地校准和重新训练以确保其在各种环境中的准确性。

### 5. 未来展望

本研究强调了机器学习在重症监护中的潜力，特别是在提高预测模型的泛化能力和操作性方面。通过结合生命体征和实验室数据，模型不仅能够提供准确的死亡率预测，还能在资源有限的ICU环境中发挥作用。然而，未来的研究仍需关注模型的可解释性和实际操作性，确保其能够被临床医生有效使用。此外，随着医疗数据的持续增长，机器学习模型的开发和验证需要更加注重数据的多样性和跨机构适用性。这可能涉及到使用更先进的特征选择方法和优化技术，以提高模型的稳定性和准确性。同时，模型的部署需要考虑计算资源的限制，确保其在实际医疗环境中具有可行性。未来的研究可以进一步探索如何将这些模型整合到现有的临床决策支持系统中，以提高重症监护的效率和效果。

联系信箱：

粤ICP备09063491号

热点排行