机器学习模型 “解锁” 创伤性脑损伤患者院内死亡风险预测新密码:精准分层,开启救治新局面

【字体: 时间:2025年02月19日 来源:Scientific Reports 3.8

编辑推荐:

  为解决 TBI 患者院内死亡率预测难题,伊朗多机构研究人员开展基于机器学习生存模型的研究。结果显示 RSF 模型表现最佳,能精准分层。该研究为临床提供新工具,有助于优化治疗决策,强烈推荐科研读者阅读。

  
在全球范围内,创伤性脑损伤(Traumatic Brain Injury,TBI)就像一个隐藏在暗处的 “健康杀手”,时刻威胁着人们的生命安全。据统计,每年每 10 万人中大约有 939 人会遭遇 TBI,这意味着全球每年新增约 6900 万例 TBI 患者。更令人担忧的是,TBI 导致的死亡人数在全球所有因伤致死案例中占比近一半,患者住院死亡率在 10% - 30% 之间波动。

在临床诊疗中,现有的评估工具却有些 “力不从心”。像格拉斯哥昏迷量表(Glasgow Coma Scale,GCS),虽然是评估 TBI 严重程度、预后和干预决策的重要工具,但它存在不少漏洞。有些 TBI 患者 GCS 评分较高,可实际上却存在危及生命的脑部损伤,GCS 却没能及时发现;在诊断轻度 TBI 和跟踪脑损伤进展方面,GCS 也表现欠佳,对插管患者的评估更是无效,还容易忽略无意识患者细微的临床变化。FOUR 评分工具虽试图弥补 GCS 的不足,但在预测患者预后方面并没有明显优势。

此外,各种预测 TBI 患者预后的评分工具,如格拉斯哥预后量表(Glasgow Outcome Scale,GOS)、Head Marshall CT 分类和 APACHE II 等,也都有各自的短板。以广泛应用于创伤中心的 Marshall 系统为例,它在预测颅内压升高风险方面有一定作用,但面对多种类型脑损伤的患者时,预测效果就大打折扣。Rotterdam 评分系统虽能在一定程度上预测 TBI 患者的院内死亡率,但由于 TBI 患者情况复杂多样,这些工具都难以精准地对患者进行分类和预测。

与此同时,传统的生存分析方法,如 Cox 回归,在处理高维数据时容易出现过拟合的问题,除非进行严格的特征选择。而机器学习(Machine Learning,ML)模型近年来在 TBI 患者预后预测方面展现出了潜力,它能根据患者的独特特征进行精准预测,还能同时处理多种类型的数据。然而,之前大多数关于 TBI 患者院内死亡率预测的 ML 研究,要么忽略了事件发生时间这一关键因素,要么没有将研究成果转化为实际的临床应用,比如明确患者的风险等级。

为了攻克这些难题,来自伊朗设拉子医科大学沙希德拉贾伊(Emtiaz)创伤医院创伤研究中心等多个机构的研究人员展开了深入研究。他们的研究成果发表在《Scientific Reports》期刊上,论文题目是 “Developing practical machine learning survival models to identify high - risk patients for in - hospital mortality following traumatic brain injury” 。研究人员通过一系列实验,成功开发出一种高性能的预测模型,为 TBI 患者院内死亡率的预测和临床干预提供了新的思路和方法。

这项研究主要采用了以下几种关键技术方法:

  1. 数据处理技术:面对数据集中存在的少量缺失值,研究人员分别对连续变量和分类变量采用均值和中位数插补法进行处理。为了让数据更适合 ML 模型,还进行了标签编码、独热编码和特征缩放等操作。
  2. 数据平衡策略:针对数据集严重不平衡的问题(80% 的患者存活,20% 的患者死亡),研究人员使用了合成少数过采样技术(Synthetic Minority Over - Sampling Technology,SMOTE)和随机过采样(Random Over - Sampling,ROS)两种策略,增加少数类样本数量,使两类样本数量均衡。
  3. 模型构建与评估技术:将数据集按 80% 和 20% 的比例分为训练集和测试集。在训练集中运用五折交叉验证和超参数调整来优化模型,使用随机生存森林(Random Survival Forest,RSF)、梯度提升生存分析(Gradient Boosting Survival Analysis,GBSA)两种监督生存 ML 算法,并以 Cox 比例风险(Cox PH)模型作为基线进行对比。利用一致性指数(C-index)、时间依赖的受试者工作特征曲线下面积(time - dependent AUC)、时间依赖的 Brier 评分(time - dependent BS)、综合 Brier 评分(Integrated Brier Score,IBS)和逆删失概率加权 C 指数(IPCW c - index)等多种指标评估模型性能。

下面让我们来看看具体的研究结果:

  1. 描述性分析:研究人员对 3705 名参与者的特征进行了分析,发现死亡组患者年龄更大,女性比例更低,高血压(HTN)、糖尿病(DM)等疾病的患病率更高。死亡组患者的 GCS 评分更低,双侧无反应瞳孔的比例更高,血红蛋白水平更低,国际标准化比值(INR)、部分凝血活酶时间(PTT)、首次随机血糖更高,血小板计数更低。此外,死亡组患者的脑实质出血(IPH)比例和 Rotterdam 评分更高,受伤机制中跌倒更为常见,机动车事故较少。
  2. 模型性能:研究比较了不同模型的性能,结果显示采用 ROS 重采样的 RSF 模型表现最佳。它的平均 AUC 达到 0.80,IBS 低至 0.11,C - index 为 0.79,在区分事件和非事件方面能力很强。与其他模型相比,GBSA 模型虽平均 AUC 也较高,但 IBS 更高;Cox PH 模型的各项指标则相对较差。而且,采用 ROS 重采样的模型性能普遍优于 SMOTE 重采样的模型。
  3. 特征重要性和时间依赖的 AUC:通过分析,确定了影响死亡率的前 6 个重要预测因素,分别是年龄、GCS、瞳孔状况、PTT、IPH 和 Rotterdam 评分。其中,年龄的预测价值最高,随着时间推移,其预测价值逐渐增加;瞳孔状况、PTT 和 Rotterdam 评分的预测价值随时间降低;IPH 的预测价值相对稳定;GCS 的预测价值在开始时较低,在第 34 天左右达到峰值,但始终不高。
  4. RSF 风险分层:研究人员根据 Youden 指数确定了最佳截断值为 63.34,以此将患者分为低风险和高风险组。 Kaplan - Meier 生存曲线显示,低风险组患者在整个随访期内的生存概率更高,两组之间的生存差异具有统计学意义。高风险组的事件发生率更高,中位生存时间更短。

综合研究结果和讨论部分,这项研究意义重大。研究开发的基于第一天特征的高性能预测模型,克服了现有临床评分系统只关注患者当前状态的局限性,能够在患者住院期间持续、稳定地评估风险。通过确定关键预测因素及其随时间变化的预测准确性,为临床医生提供了更全面、准确的信息。而且,研究首次为 TBI 患者制定了基于急诊情况的个体风险评分,有助于医生根据患者的风险等级调整干预措施的频率,既可以及时救治高风险患者,又能避免对低风险患者进行不必要的医疗干预,节省医疗成本。不过,该研究也存在一些局限性,比如数据仅来自单一数据库,可能影响模型的通用性;过采样虽改善了类别平衡,但存在过拟合风险;数据库还缺少一些可能影响结果的变量,如院前数据和手术干预细节等。未来的研究可以在这些方面加以改进,进一步推动机器学习模型在 TBI 临床诊疗中的应用,为 TBI 患者带来更多的希望和更好的治疗效果。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号