编辑推荐:
脓毒性休克死亡率高且预警困难,缺乏有效预后预测模型。研究人员开展基于人工智能的多中心回顾性研究,构建 TOPSIS 分类融合(TCF)模型。该模型在多中心及跨专科验证中表现良好,为临床提供可靠预警工具,助力降低死亡率。
在重症监护室(ICU)的战场上,脓毒性休克(septic shock)就像一个可怕的 “杀手”,时刻威胁着患者的生命。它是由脓毒症引发的严重循环和细胞代谢紊乱综合征,也被称为感染性休克,属于分布性休克的一种。按照 2016 年发布的《国际脓毒症和感染性休克定义共识》第三版中的临床诊断标准,脓毒症患者在充分液体复苏后仍存在持续低血压,需要使用血管收缩药物维持平均动脉压不低于 65 mmHg ,且血清乳酸水平大于 2 mmol/L ,就可诊断为脓毒性休克。
如此凶险的病症,死亡率高得惊人。有研究通过回顾性队列分析健康记录数据,发现脓毒性休克患者的院内死亡率达 15%;还有研究利用国家重症监护数据库,得出该病症患者死亡率为 55.5% 。在 Michael Bauer 对众多研究的综述中,脓毒性休克患者 30 天的观察死亡率为 34.73%(32.61 - 36.85%)。这么高的死亡率,让医生们倍感压力。要是能早点预测患者的病情发展,提前发出预警,医生们就能争取更多时间,采取更积极有效的治疗措施,说不定就能降低死亡率,挽救更多生命。然而现实却很残酷,由于脓毒性休克患者病情复杂,目前还没有一种有效的模型能精准预测患者的预后。
为了解决这一难题,华中科技大学同济医学院附属同济医院的研究人员挺身而出,开展了一项极具意义的研究。他们的研究成果发表在《npj Digital Medicine》上,为脓毒性休克的防治带来了新的希望。
研究人员采用了多种关键技术方法。首先,他们从三家医院 2003 年 2 月至 2023 年 11 月的电子病历中,收集了 4872 例 ICU 患者的临床信息,这些患者均患有脓毒性休克。接着,对收集到的 93 项院内指标进行数据预处理,包括删除缺失率大于 30% 的特征、处理布尔特征、选择合适的缺失值插补方法、筛选相关性过高的特征以及根据信息熵选择最优特征子集等,最终确定了 34 个关键特征。之后,利用这些数据训练了 7 个基础模型,包括决策树(DT)、随机森林(RF)、XGBoost(XGB)、LightGBM(LGBM)、朴素贝叶斯(NB)、支持向量机(SVM)、梯度提升决策树(GBDT),并采用合成少数过采样技术(SMOTE)处理数据不平衡问题。最后,运用基于逼近理想解排序法(TOPSIS)将 7 个基础模型融合,构建出 TOPSIS 分类融合(TCF)模型。
下面来看具体的研究结果:
- 研究人群特征和队列组成:研究的 ICU 队列包含 3451 名参与者,其中 721 名结局为阳性(28 天内死亡),2730 名结局为阴性。儿科重症监护室队列(cohort 1 - 1)有 357 人,52 人结局阳性;呼吸重症监护室队列(cohort 1 - 2)有 381 人,60 人结局阳性。两个外部验证队列中,cohort 2 有 422 名参与者,100 人结局阳性;cohort 3 有 261 名参与者,75 人结局阳性。研究数据具有优势,用于模型构建的数据(Cohort 1)来自综合 ICU,参与者背景复杂多样,理论上有助于构建广泛适用的脓毒性休克预测模型。而且,研究不仅进行了多中心验证,还开展了跨专科验证,进一步体现了模型的广泛适用性。
- 特征选择和优化过程:对训练数据进行序列特征化处理,经过一系列筛选步骤,最终确定了 34 个指标作为 7 个子模型和 TCF 的最终输入特征,这些指标涵盖了患者的年龄、手术史、体温、舒张压等多方面信息。
- TCF 模型性能和子模型比较:通过训练集对模型进行参数优化和子模型训练,基于内部验证集进行模型融合和权重分配。结果显示,TCF 模型在两个综合评价指标上优于子模型,其受试者工作特征曲线下面积(AUC)为 0.733(95% CI:0.694 - 0.774),F1 评分(F1 - score)为 0.458(0.398 - 0.520) 。虽然 TCF 模型在识别阳性(敏感度 SEN 0.640(0.557 - 0.712))和阴性(特异度 SPE 0.700(0.663 - 0.736))方面并非最优,但它能整合子模型的偏倚识别效果,整体性能最佳。校准曲线和决策曲线分析(DCA)也表明 TCF 模型的预测与实际结果相符,具有一定临床实用性。
- 特征重要性和模型解释:选择 AUC 表现最佳的 GBDT 模型,通过绘制 SHAP 特征重要性热图可视化其特征重要性。结果发现,复苏次数(NOR)、机械通气时间(DOMV)、ICU 住院时长(LOC - ICU)、舒张压(DBP)等临床特征对结局影响较大。TCF 模型的加权特征重要性与 GBDT 基本一致,其特征重要性排名也具有参考价值。
- 多中心验证和泛化能力:多中心验证结果显示,与内部验证集相比,TCF 模型在 cohort 1 - 2 上 AUC 略有下降(AUC 0.662(95% CI:0.598 - 0.730)) ,但在 cohort 1 - 1(AUC 0.808(0.740 - 0.864))、cohort 2(AUC 0.784(0.733 - 0.825))和 cohort 3(AUC 0.786(0.725 - 0.840))上 AUC 显著提高。将四个外部验证数据集合并后进行预测,AUC 达到 0.7705(0.7417 - 0.7983)。校准曲线和 DCA 表明,TCF 模型能有效区分低风险脓毒性休克患者,在大部分阈值概率范围内,模型干预的净效益高于 “全治疗” 和 “不治疗” 策略,在 0.1 - 0.5 的阈值概率范围内,净效益更明显,说明该模型的预测在这一范围内具有重要临床决策价值。
研究结论和讨论部分意义重大。研究构建的 TCF 模型,基于 34 个电子病历中的患者特征,能稳定、准确地预测脓毒性休克患者 28 天内的死亡风险,预测性能显著优于 7 个基础模型。该模型为 ICU 临床医生提供了有力工具,能辅助实时预测患者死亡风险,尤其在疾病恶化早期或基层医疗经验有限的情况下,帮助医生更好地理解脓毒症和脓毒性休克的进展机制。而且,TCF 模型稳定性和泛化能力强,在不同 ICU 患者群体中都表现出色。不过研究也存在一些局限性,如预测变量数量可进一步优化、样本量和样本比例不平衡问题有待改善、模型在更广泛地区的泛化性需进一步探索、可尝试整合更多数据模态、未来可开展前瞻性研究评估模型临床疗效等。但总体而言,这项研究为脓毒性休克的早期干预提供了可靠依据,为后续研究指明了方向,有望推动脓毒性休克临床救治水平的提升。