乳酸/白蛋白比值(LAR)预测危重症COVID-19患者死亡率:一项基于MIMIC-IV数据库的机器学习回顾性研究

《Scientific Reports》:Lactate/albumin ratio predicts mortality in critically ill COVID-19 patients: a retrospective machine learning study

【字体: 时间:2025年10月19日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对危重症COVID-19患者预后评估难题,通过分析MIMIC-IV数据库中1,127例患者数据,发现乳酸/白蛋白比值(LAR)是28天死亡率的独立预测因子(HR=1.309)。研究采用限制性立方样条(RCS)揭示LAR与死亡率存在非线性关系(P<0.001),并通过随机生存森林(RSF)模型实现优越预测性能(AUC:0.887)。该成果为危重症患者风险分层提供了新型生物标志物和临床决策工具。

  
新型冠状病毒肺炎(COVID-19)自2019年底暴发以来,已在全球造成约7.77亿感染病例和超过700万死亡病例,总体病死率接近0.91%。尽管疫苗和抗病毒治疗降低了传播风险,但新变异株的出现和医疗资源分配不均使得疫情持续蔓延。特别值得关注的是,14%的确诊感染被归类为重症,5%为危重症,其中危重症患者的死亡率高达63.5%。约有5%的合并基础疾病的感染者需要入住重症监护室(ICU)。危重症COVID-19的临床管理面临诸多挑战,包括疾病快速进展需要及时干预、多因素发病机制使预后评估复杂化,以及缺乏标准化的多维度结局预测指标。
在这些危重症患者中,乳酸/白蛋白比值(LAR)作为一种新型综合标志物,能够同时反映全身炎症反应和代谢负荷。其潜在机制涉及乳酸升高和低白蛋白血症的相互作用,各自具有独特但互补的病理生理学意义。乳酸积累主要由细胞缺氧和氧供需失衡条件下的无氧糖酵解转变驱动。此外,肝肾功能灌注受损会降低乳酸清除率,而炎症因子风暴会破坏线粒体功能,进一步加剧乳酸水平。同时,低白蛋白血症反映了白细胞介素(如IL-6、TNF-α)介导的肝脏合成抑制、内皮损伤导致的毛细血管通透性增加以及氧化应激诱导的白蛋白消耗。乳酸通过激活缺氧诱导因子-1α(HIF-1α)放大炎症级联反应,而低白蛋白血症会削弱抗氧化防御并加剧组织损伤。通过整合这两个指标,LAR可以同时捕捉急性代谢紊乱和慢性营养储备状态。
为了验证LAR在危重症COVID-19患者中的预测价值,研究人员开展了一项回顾性机器学习研究,论文发表在《Scientific Reports》期刊。该研究利用MIMIC-IV数据库,评估了LAR对危重症COVID-19患者28天死亡率的预测能力。
研究采用的主要技术方法包括:从MIMIC-IV(版本3.1)公共数据库中提取1,127例COVID-19患者的临床数据;使用限制性立方样条(RCS)分析LAR与死亡率的非线性关系;采用Boruta算法和LASSO回归进行特征选择;通过随机生存森林(RSF)等8种机器学习算法构建预测模型;使用Kaplan-Meier生存分析和Cox比例风险模型评估预后因素。
患者基线特征
研究共纳入1,127例COVID-19患者,中位年龄67岁。按LAR四分位数分组后显示,最高四分位数组患者年龄更大、男性比例更高、查尔森合并症指数(CCI)和序贯器官衰竭评估(SOFA)评分显著升高。实验室参数也呈现显著差异,最高LAR组表现出白细胞计数升高、红细胞计数降低、血小板减少、白蛋白降低和乳酸升高等特征。
Kaplan-Meier生存分析
Kaplan-Meier生存曲线显示,LAR四分位数分层揭示了组间生存概率的显著梯度差异。在28天观察期内,最高LAR四分位数(0.82-7.59)患者的生存概率最低,较低四分位数患者的生存情况逐步改善。LAR水平与生存结局呈显著负相关,LAR升高对应预后较差。对数秩检验证实了这些差异的统计学显著性(P<0.001)。
特征选择
特征选择采用混合方法,结合Boruta算法、10折LASSO回归和单因素分析。通过维恩图取交集后,最终确定了8个核心预测因子。Cox模型证明,筛选后的模型在维度减少61%的情况下仍保持判别能力。
LAR水平与临床结局的关联
多变量Cox回归验证LAR与28天死亡风险独立相关(HR=1.309, 95% CI: 1.113-1.540)。当按四分位数分析时,与Q1组相比,Q4组患者始终显示最高的28天死亡风险。在完全调整的模型中,Q4患者的HR为2.85(95%CI:1.74-4.68;P<0.001),Q3患者风险也显著升高(HR=2.29;95% CI:1.40-3.76;P=0.001)。四分位数趋势检验证实了LAR水平升高与死亡风险之间存在显著的剂量反应关系。
限制性立方样条分析
限制性立方样条(RCS)分析评估了LAR与28天生存率的潜在非线性关联。在未调整分析中,LAR与28天死亡率呈倒"L"形非线性关系(P<0.001)。观察到阈值效应:28天死亡率的LAR阈值为0.874。在调整协变量因素后,RCS分析仍观察到LAR与28天死亡率之间存在显著非线性关系(P<0.001),LAR阈值为0.883。
回归和亚组分析
亚组分析显示,在大多数亚组中,LAR四分位数升高始终与较高的死亡风险比(HR)相关。交互作用分析显示大多数亚组无统计学显著效应修饰,表明该关联基本一致。然而,在机械通气亚组中观察到显著交互作用(P=0.043)。
LAR与其他指标的预测性能比较
ROC曲线分析评估了LAR对28天死亡率的预测准确性,并与几种既定的临床指标和评分系统进行比较。在所有指标中,SOFA评分显示出最高的判别能力(AUC=0.677)。LAR紧随其后(AUC=0.662),优于其他炎症和复合指标,包括中性粒细胞/淋巴细胞比值(NLR)、红细胞分布宽度/血小板比值(RPR)和红细胞分布宽度/白蛋白比值(RAR)。
机器学习预测模型的构建与验证
研究将数据按7:3比例随机分为训练集和验证集,实施了8种机器学习算法。随机生存森林(RSF)模型表现出优越的预测能力,在训练集和测试数据集中对14天(AUC:0.948)和28天(AUC:0.887)死亡率预测均表现出强劲的整体预测性能。
校准图显示,预测的总生存(OS)概率与观察到的OS密切匹配,特别是在高风险范围内,表明RSF模型具有稳健的校准能力。
研究结论与意义
这项回顾性研究证实了乳酸/白蛋白比值(LAR)在预测危重症COVID-19患者短期死亡率方面的预后效用。与常规生物标志物相比,LAR表现出更高效和可解释的预测性能,同时增强了疾病结局的临床分层能力。通过随机生存森林(RSF)机器学习模型,研究人员观察到基于LAR的预测具有优越的敏感性和特异性。后续分析进一步确定了LAR水平与死亡风险之间存在稳健的正相关。
这些发现表明,LAR作为一种具有临床价值的生物标志物,可用于结局预测,并可能支持高危患者群体的个性化决策。LAR的计算简便性及其基于易于理解的代谢和营养参数的特点,使其特别具有临床整合吸引力。尽管存在单中心数据来源和缺乏长期随访数据等局限性,但这项研究为危重症COVID-19患者的风险分层提供了新的见解和实用工具。
未来研究应关注多中心外部验证、不同病毒变异株的影响以及长期预后评估,进一步优化LAR在临床实践中的应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号