在新的全球性急性呼吸窘迫综合征(ARDS)定义背景下:一种可解释的机器学习方法,用于预测因ARDS并发症而出现败血症的患者的28天重症监护病房(ICU)死亡率
《Frontiers in Physiology》:Under the background of the new global definition of ARDS: an interpretable machine learning approach for predicting 28-day ICU mortality in patients with sepsis complicated by ARDS
【字体:
大
中
小
】
时间:2025年09月20日
来源:Frontiers in Physiology 3.4
编辑推荐:
基于新全球定义的脓毒症合并急性呼吸窘迫综合征(ARDS)预后预测模型的机器学习研究,通过MIMIC-IV数据库提取905例患者数据,采用Lasso回归筛选出15个关键变量,构建并验证了支持向量机(SVC)等8种机器学习模型。结果显示SVC模型内部验证AUC为0.792,外部验证达0.816,SHAP分析揭示了年龄、RDW、乳酸水平等关键影响因素。
### 解读:基于新全球定义的脓毒症合并急性呼吸窘迫综合征患者预后预测模型研究
#### 背景与研究意义
脓毒症是一种由感染引发的全身炎症反应综合征,通常会导致多器官功能障碍,严重威胁生命安全。根据《2016年脓毒症定义》(Sepsis-3.0),脓毒症被定义为宿主对感染的反应异常,导致生命危险的多器官功能障碍。近年来,全球范围内脓毒症的发病率和死亡率持续上升,已成为重症监护病房(ICU)中常见的临床问题之一。
在脓毒症的病理过程中,肺部往往是最早和最常受累的器官之一。脓毒症患者可能发展为急性肺损伤(ALI)或更严重的急性呼吸窘迫综合征(ARDS),其特征包括难以纠正的低氧血症和呼吸困难。ARDS的诊断和评估依赖于多种参数,如血气分析中的氧合指数(PaO2/FiO2比值)、机械通气的使用情况以及肺部影像学检查结果。然而,随着临床实践的深入,一些专家发现传统诊断标准存在一定的局限性。
2023年,32位来自全球的重症监护专家联合发布了新的全球ARDS定义。这一定义在多个方面进行了重要更新,特别是在诊断标准和影像学评估方面。例如,新定义将非侵入性通气和高流量鼻导管吸氧(HFNO)纳入诊断范围,并引入了基于脉搏血氧饱和度的SpO2/FiO2比值作为关键指标。此外,肺部超声也被纳入作为影像学评估的补充手段。这些变化使得ARDS的诊断更加灵活和广泛,有助于更早识别病情,并为临床决策提供更全面的信息。
脓毒症合并ARDS(S-ARDS)是导致脓毒症患者死亡的重要因素。根据相关研究,全球每年约有15万至20万例患者因脓毒症合并ARDS而死亡,其死亡率比单纯脓毒症患者高出30%至40%。因此,建立一个可靠且有效的临床预后预测模型,对于识别高风险患者、优化治疗方案以及改善患者预后具有重要意义。
机器学习(Machine Learning, ML)作为一种人工智能的重要分支,能够通过数据挖掘和模式识别,实现对复杂医学数据的自动处理和决策支持。近年来,ML在临床预后预测模型的开发中展现出巨大的潜力。例如,有研究团队利用ML技术构建了早期识别ICU获得性脓毒症的模型,其特异性和敏感性分别达到了83.8%和73.3%。此外,还有研究基于ML技术建立了针对脓毒症合并急性肾损伤患者的预后模型,并在外部验证中取得了良好的预测效果。
在脓毒症合并ARDS的预后预测领域,尽管已有研究利用旧版的柏林定义(Berlin Definition)构建了相关模型,但基于新全球定义的研究仍较为有限。因此,本研究旨在利用新全球定义,结合机器学习技术,构建一个可解释的预后预测模型,用于评估脓毒症合并ARDS患者的28天ICU死亡率,并验证其在不同人群中的适用性。
#### 方法与技术路线
本研究的数据来源主要包括两个部分:一是来自美国贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)的MIMIC数据库(版本为MIMIC-IV 2.2),二是来自徐州医科大学附属医院的脓毒症合并ARDS患者数据。选择MIMIC-IV 2.2版本的主要原因是,尽管该数据库后续有更新版本(如3.1),但新版本中的临床记录模块尚未完全更新,影响了ARDS诊断所需的关键信息,如肺部影像学和临床记录的完整性。因此,为了确保数据的一致性和完整性,研究采用了较早的2.2版本进行建模。
MIMIC数据库包含了超过19万名患者的数据,覆盖了从2008年至2019年的ICU住院记录,其中包括约7万名ICU入住患者。这些数据涵盖了患者的临床特征、生命体征、实验室检查结果、影像学资料、临床并发症以及治疗记录,为构建和验证临床预后模型提供了丰富的数据基础。此外,数据库中的患者信息已进行匿名化处理,确保了数据的隐私性和合规性。
为了识别脓毒症合并ARDS的患者,研究团队采用了两种诊断标准:柏林定义和新全球定义。柏林定义要求ARDS在ICU入住后1周内发生,肺部影像学显示双侧肺部浸润或水肿,并且排除心源性肺水肿。同时,患者需要接受机械通气,且PaO2/FiO2比值≤300 mmHg。相比之下,新全球定义在保留原有标准的基础上,增加了对非机械通气患者的诊断可能性。例如,对于接受高流量鼻导管吸氧(HFNC)的患者,只要氧气流量≥30 L/min,即使未使用机械通气,也可被纳入ARDS诊断范围。此外,新定义还允许在资源有限的环境中,仅通过脉搏血氧饱和度(SpO2)和SpO2/FiO2比值进行诊断,这在一定程度上扩大了ARDS的诊断范围,有助于早期识别病情。
在数据提取过程中,研究团队首先使用SQL语句和Navicat Premium软件(版本16.3.8)从MIMIC-IV数据库中提取了原始数据。这些数据包括患者的基本信息、生命体征、实验室检查结果、影像学资料、临床并发症以及治疗记录。为了确保数据的完整性和一致性,研究团队对缺失值进行了处理,剔除了缺失率超过30%的变量,如碳酸氢盐和白蛋白。对于剩余的缺失值,研究采用多重插补法(Miceforest)进行填补,以减少数据缺失对模型性能的影响。在特征选择阶段,研究利用Lasso回归结合交叉验证(Lasso CV)对64个候选特征进行了筛选,最终确定了15个关键变量用于构建机器学习模型。
为了提高模型的泛化能力和预测准确性,研究采用了嵌套交叉验证策略。该策略包括一个外层的5折交叉验证,其中一次折作为外层测试集,其余四次作为外层训练集。在训练集内部,又进行了10折交叉验证,用于调整模型的超参数。整个过程重复五次,每次数据集被重新洗牌,从而生成25个独立模型。最终,模型的性能评估基于这25个模型的平均值和95%置信区间,以减少数据划分对结果的影响。
此外,为了应对数据不平衡问题,研究团队采用SMOTE和Tomek Link技术对数据进行重采样,以提高模型的稳定性和泛化能力。在超参数优化过程中,研究使用了贝叶斯优化方法,寻找最优的模型参数组合。最终,研究选择了8种机器学习算法进行模型构建和比较,包括逻辑回归(Logistic Regression, LR)、随机森林(Random Forest, RF)、决策树(Decision Tree, DT)、支持向量机(Support Vector Machine, SVM)、LightGBM、XGBoost、AdaBoost和多层感知机(Multilayer Perceptron, MLP)。这些模型的性能评估指标包括ROC曲线、AUC值、准确率、敏感性、特异性、召回率、F1分数等。
为了增强模型的可解释性,研究还引入了SHAP(Shapley Additive Explanations)分析。SHAP是一种基于博弈论的模型解释方法,能够揭示每个特征对预测结果的贡献程度。通过计算和可视化SHAP值,研究团队不仅能够理解模型的决策过程,还能够为临床提供更具针对性的解释。
#### 结果与分析
本研究共纳入了905名符合新全球定义的脓毒症合并ARDS患者,并将他们分为生存组和非生存组,以评估不同变量对预后的影响。在模型构建过程中,研究团队首先通过Lasso回归筛选出15个关键变量,包括年龄、平均SpO2、平均体温、红细胞分布宽度(RDW)、合并转移性实体瘤、乳酸水平、尿量、平均呼吸频率、国际标准化比值(INR)、碱性磷酸酶、平均红细胞体积、平均心率、Logistic器官功能评分(LODS评分)、合并风湿性疾病、血小板计数等。
在模型性能评估方面,SVC模型在内部验证集和外部验证集中均表现出较强的预测能力。在内部验证集中,SVC模型的平均AUC值为0.792,而在外部验证集中,该模型的AUC值进一步提升至0.816。这表明SVC模型不仅在训练数据中表现良好,而且在实际临床环境中也具有较高的泛化能力。此外,SVC模型在其他评估指标(如F1分数、召回率、准确率、特异性等)中也普遍优于其他模型。
为了进一步验证模型的临床适用性,研究团队还绘制了ROC曲线、临床决策曲线(DCA)和校准曲线。ROC曲线主要用于评估模型的分类能力,而DCA曲线则反映了模型在不同阈值下的临床净收益。校准曲线则用于评估模型预测概率与实际概率的一致性,确保模型输出的可靠性。从这些曲线中可以看出,SVC模型在多个方面均表现出色,能够为临床提供有价值的预测信息。
在模型的可解释性分析中,研究团队通过SHAP值和可视化图表,揭示了各个变量对预后的影响。例如,年龄、RDW、合并转移性实体瘤、LODS评分和尿量被识别为对28天ICU死亡率具有显著影响的变量。其中,较高的RDW值与较高的死亡率呈正相关,这可能与脓毒症引起的炎症反应、微循环障碍以及铁代谢紊乱有关。年龄的增加则伴随着死亡风险的上升,尤其是在65.71岁之后,其对预后的影响由负转正,表明高龄患者是S-ARDS的重要高危人群。尿量的减少则可能反映微循环功能障碍,是预测死亡率的重要指标。
此外,研究还发现,血乳酸水平、INR、平均红细胞体积、平均心率和平均呼吸频率等指标也与死亡率呈正相关。血乳酸水平升高通常与组织缺氧和微循环障碍相关,而INR升高可能反映凝血功能障碍,进而影响患者预后。平均红细胞体积的升高可能与炎症反应或营养状况有关,而平均心率和呼吸频率的变化则可能反映机体对感染的反应程度。
值得注意的是,研究还发现,尿量和平均体温与死亡率呈负相关。尿量充足通常表明肾脏灌注良好,能够有效响应液体复苏,从而降低死亡风险。而平均体温升高可能提示炎症反应的活跃,一些研究表明,适度的发热可能具有一定的保护作用,而低体温则可能与免疫抑制和死亡率增加相关。因此,这些变量的生物学意义与临床观察结果一致,为模型的解释提供了支持。
在对不同诊断标准下的ARDS患者进行比较时,研究发现新全球定义下的患者分类与柏林定义下的患者分类在疾病严重程度和死亡率方面没有显著差异。这表明新定义在临床应用中具有较高的兼容性,并且能够有效涵盖更广泛的患者群体。此外,研究还发现,新定义下的模型在外部验证集中表现良好,表明其在不同医疗机构中的适用性。
#### 讨论与临床意义
本研究构建的基于SVC的预后预测模型在多个方面展现出显著的临床价值。首先,该模型能够准确预测脓毒症合并ARDS患者的28天ICU死亡率,为临床提供可靠的预后信息。其次,模型的可解释性较强,能够揭示关键变量对预后的影响,从而帮助医生更好地理解模型的决策逻辑,并在临床实践中进行更精准的干预。
从临床角度来看,模型中所识别的关键变量具有重要的指导意义。例如,RDW的升高可能提示患者存在严重的炎症反应和微循环障碍,而尿量的减少则可能反映肾脏功能受损。年龄的增加与死亡率的上升密切相关,尤其是在65岁以上的患者中,死亡风险显著增加。这可能与老年人免疫功能下降、营养状况较差以及多器官功能障碍有关。此外,合并转移性实体瘤的患者死亡率更高,这可能与肿瘤本身对免疫系统的抑制作用以及抗肿瘤治疗的副作用有关。
另一方面,某些变量如风湿性疾病可能具有一定的保护作用。然而,目前关于风湿性疾病与脓毒症之间的关系尚不明确,因此需要进一步研究来验证这一发现。此外,研究团队发现,某些变量如血小板计数和碱性磷酸酶水平也与死亡率相关,但其具体机制仍需深入探讨。
尽管本研究取得了显著成果,但也存在一定的局限性。首先,MIMIC数据库中的患者数据主要来源于西方国家,而外部验证数据来自中国,这可能导致模型在不同人群中的适用性存在差异。其次,研究团队仅考虑了部分临床数据,未对数据库进行全面分析,可能遗漏了一些关键变量。最后,由于本研究为回顾性分析,可能受到数据收集过程中的偏倚影响。
#### 结论
综上所述,本研究利用机器学习技术构建了一个基于新全球定义的脓毒症合并ARDS患者的预后预测模型。该模型不仅在训练数据中表现出良好的预测能力,而且在外部验证集中也具有较高的泛化性。此外,通过SHAP分析,研究团队揭示了关键变量对预后的影响,为临床提供可解释的预测信息。
这一研究为临床医生提供了一种新的工具,以更精准地识别高风险患者,并制定个性化的治疗方案。未来,随着更多数据的积累和模型的进一步优化,该模型有望在临床实践中发挥更大的作用,从而提高脓毒症合并ARDS患者的生存率和治疗效果。此外,研究还为后续探索ARDS的病理机制和临床特征提供了新的思路和方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号