《Injury》:Development and Multicenter Validation of a Machine Learning Model for Postoperative Sepsis Risk in Critically Ill Traumatic Spinal Injury Patients
编辑推荐:
本研究开发并验证了首个用于危重创伤性脊髓损伤(TSI)患者术后脓毒症的机器学习模型,通过整合MIMIC-IV和eICU-CRD数据库及中国TSI队列数据,结合Boruta和Group-Lasso回归筛选变量,构建13基学习者的集成模型,验证其在训练集和外部验证集(AUC 0.889-0.938)中表现出优异的预测性能,并通过SHAP分析揭示手术负担、病情严重程度、血流动力学等关键预测因子。
王一熙|李文哲|崔健|王泽曦|李玉倩
新疆医科大学第一附属医院微创脊柱与精准骨科部门,乌鲁木齐,中国
摘要
目的
开发并验证一个机器学习模型,用于预测重症创伤性脊柱损伤(TSI)患者术后的败血症。这是一种常见且严重的并发症,目前缺乏专门的预测工具。
方法
模型开发使用了MIMIC-IV 3.1数据库,并在eICU-CRD 2.0数据库和中国TSI队列中进行了外部验证。术后24小时内记录的变量通过单变量测试进行筛选,并通过Boruta和Group-Lasso回归进行优化,以确定最终的预测因子。训练了13个基础学习器,并通过五折交叉验证将其组合成一个堆叠集成模型。性能评估采用了接收者操作特征(ROC-AUC)、精确度-召回率(PR-AP)平均值、校准曲线、决策曲线和提升曲线,以及准确性、敏感性、特异性、精确度和F1分数。通过SHAP分析评估了模型的可解释性。
结果
开发队列包括808名患者,其中461例(57.1%)发生败血症;外部验证队列包括358名患者,其中86例(24.0%)发生败血症。最终有12个预测因子被纳入模型。堆叠模型在训练阶段的ROC-AUC为0.918,PR-AP为0.938;在验证阶段的ROC-AUC为0.889,PR-AP为0.936。该模型具有良好的校准性能,临床实用性得到决策曲线和提升曲线的证实,分类指标也表现均衡。大多数一级模型的性能明显下降。外部验证证实了模型的一致性以及有效的高风险分层能力。SHAP分析表明,手术负担、病情严重程度、血液动力学、肾脏功能和凝血系统是关键影响因素,确保了模型在队列和个体层面的可解释性。
结论
这是首个针对重症TSI患者术后败血症的验证模型,表现出相对稳健的性能和良好的可解释性,有助于早期风险分层并支持临床决策。
引言
在创伤情况下,术后败血症会带来重大的临床和经济负担,包括长时间的重症监护、多器官衰竭和高死亡率。其发生与免疫失调和开放性伤口有关,这些因素为病原体的侵入提供了条件,而手术和机械通气会进一步加剧这一过程[1]。重症创伤性脊柱损伤(TSI)患者尤其脆弱,因为他们通常需要复杂的固定手术和密集的术后护理,同时脊髓损伤还会导致全身功能障碍,从而增加败血症的风险,因此亟需进行早期风险分层[2]。
然而,大多数关于脊柱手术术后败血症的研究集中在稳定条件下的选择性手术上,所开发的预测模型对于重症TSI患者的适用性尚不确定,因为这两者在损伤严重程度、生理状态和围手术期管理方面存在差异[3]。目前针对这一人群的证据仅限于一项回顾性研究,该研究将颈椎损伤、脊髓损伤和并发症确定为风险因素,但未建立预测模型,且仅限于手术治疗的椎体骨折病例,限制了模型的普遍适用性[4]。
为填补这些空白,本研究利用术后24小时内ICU入住的临床数据,开发了一个用于预测重症TSI患者术后败血症的机器学习模型。该模型在MIMIC-IV 3.1数据库上进行训练,并在eICU-CRD 2.0数据库和中国TSI队列中进行了外部验证,成为首个专门针对这一高风险人群的通用早期风险分层工具,具有指导及时干预和改善预后的潜力。
数据来源
用于预测重症TSI患者术后败血症的模型是基于麻省理工学院发布的MIMIC-IV 3.1数据库开发的[5](无需签署知情同意书,认证编号57264471)。其通用性通过eICU-CRD 2.0数据库和中国新疆医科大学第一附属医院的数据进行了外部验证[6]。
研究人群和基线特征
MIMIC-IV数据库共纳入了865名接受手术治疗的重症TSI患者,其中461人在ICU期间发生败血症。对有无败血症患者的单变量分析显示,多个临床变量之间存在显著差异(P < 0.05,见表1)。外部验证队列包括358名患者,其中214人来自eICU数据库,144人来自新疆医科大学第一附属医院,共有86例败血症病例(见补充表1)。
特征选择与验证
讨论
本研究首次探讨了重症TSI患者术后败血症的风险,其发病率(57.1%)远高于非创伤性病例(3.1%),与严重创伤病例的发病率(63%)相当[4,8],这凸显了长期以来对这一人群的忽视。通过整合手术特征、合并症负担、病情严重程度、生命体征和实验室检测结果,本研究开发出了高性能的预测模型,以解决这一关键问题。
SHAP分析进一步证实了这些因素在模型中的作用。
结论
术后败血症是重症TSI患者中常见但被忽视的并发症,需要可靠的工具进行早期风险分层。本研究提出了首个经过验证的机器学习模型,具有可靠的性能和良好的可解释性,可为临床决策提供支持。将其整合到围手术期护理中,有望实现更早的干预、优化资源分配,并最终改善患者预后。
伦理批准与参与同意
本研究遵循赫尔辛基宣言进行,使用了MIMIC-IV(版本3.1)和eICU协作研究数据库(版本2.0)中的数据,这两个数据库均为公开且去标识化的重症监护数据集。访问权限通过PhysioNet的培训认证获得(认证编号:57264471)。
出版同意
本研究使用的是来自公开数据库的去标识化数据及机构记录,未包含任何可识别患者身份的信息。
数据与材料的获取
MIMIC-IV(版本3.1)和eICU协作研究数据库(版本2.0)可通过PhysioNet仓库(https://physionet.org/ )获取,需经过授权访问。新疆医科大学第一附属医院的临床数据由于机构和患者隐私规定无法公开,但可根据合理请求并获得适当伦理批准后提供。
资助
本研究得到了新疆维吾尔自治区自然科学基金青年项目和新疆医科大学自然科学基金青年项目的支持。
作者贡献
Y.W.和W.L.对本研究贡献均等,共同担任第一作者。Y.W.、W.L.和Y.L.负责概念设计、数据整理、模型开发及统计分析;Y.W.、J.C.和Z.W.参与数据提取和临床注释;Y.L.提供了临床见解,参与了结果解读,并对稿件进行了严格审阅。所有作者均审阅并批准了最终稿件。
< RediT作者贡献声明
王一熙: 概念设计、数据整理、正式分析、软件开发、验证、可视化、初稿撰写、修订与编辑、方法学设计。
李文哲: 概念设计、数据整理、正式分析、方法学设计、验证、初稿撰写、修订与编辑。
崔健: 数据整理、研究实施。
王泽曦: 数据整理、研究实施。
李玉倩: 概念设计、数据整理、资金筹集、研究实施、资源协调、修订与编辑。