CICL 机器学习框架:精准分类颅内压时段,开启脑损伤诊疗新篇章

【字体: 时间:2025年04月12日 来源:npj Digital Medicine 12.4

编辑推荐:

  急性脑损伤患者面临颅内压(ICP)升高的生命威胁,临床常用外部脑室引流(EVD)监测和治疗 ICP,但现有机器学习模型因 EVD 数据标注问题受限。研究人员开展 “Classification of intracranial pressure epochs using a novel machine learning framework” 研究,开发 CICL 框架,能有效分类 EVD 的 ICP 数据,为 ICP 危机预测等奠定基础。

  在医学领域,急性脑损伤一直是严重威胁患者生命健康的难题。颅内压(Intracranial Pressure,ICP)升高作为急性脑损伤常见且危险的并发症,犹如一颗隐藏在患者体内的 “定时炸弹”。当患者遭受急性脑损伤时,无论是创伤性颅内损伤,还是非创伤性的如颅内出血、大面积急性缺血性中风等,都可能引发 ICP 升高。由于颅骨的限制,颅内空间有限,一旦发生损伤,脑、脑脊液(Cerebrospinal Fluid,CSF)和血液这三种颅内主要成分的平衡被打破,就会导致 ICP 急剧上升。过高的 ICP 会压迫脑组织,引发脑出血、缺血性中风,甚至在极端情况下造成脑疝,导致患者死亡。
目前,外部脑室引流(External Ventricular Drains,EVD)是监测和管理 ICP 的金标准。它通过在患者颅骨内插入导管,既能在 “夹紧” 状态下准确测量 ICP 波形,又能在 ICP 过高时通过引流 CSF 来降低压力。然而,传统的临床指南大多仅关注平均 ICP 值,忽略了 ICP 波形中丰富的生理信息。近年来,随着机器学习(Machine Learning,ML)和人工智能技术的发展,利用 ICP 波形更多特征来预测 ICP 升高的研究成为热点。但现有研究存在一个重大缺陷,由于缺乏 EVD 夹紧状态的数字标签,大量包含 EVD 数据的患者被排除在研究之外,导致模型的泛化性严重受限。这就好比在拼图游戏中,缺失了关键的几块拼图,使得整个画面无法完整呈现。为了解决这一问题,来自约翰霍普金斯大学医学院(Johns Hopkins University School of Medicine)等机构的研究人员开展了一项重要研究,相关成果发表在《npj Digital Medicine》上。

研究人员采用了多种关键技术方法。在数据处理方面,他们从约翰霍普金斯医院和约翰霍普金斯湾景医疗中心的神经科学重症监护病房(Neurosciences Critical Care Units,NCCUs)收集患者数据,经过严格的纳入标准筛选,获取了符合条件的患者 ICP 数据。利用基于内核的变化点检测方法,将 ICP 波形时间序列自动分割成不同的时段(epoch),并对数据进行清洗,去除噪声和异常值。在模型构建上,运用无监督 K 均值聚类算法对时段进行初步分组,然后结合神经重症专家的手动标注,为模型训练提供准确标签。通过测试多种监督机器学习算法,最终选择 XGBoost 算法构建分类模型,并进行特征工程和选择,确定了最优的特征组合。

研究结果如下:

  • 数据集特征:从 41 名患者的 EVD 中提取了 43 个 ICP 波形时间序列,将其分为 3 个数据集。数据集 1 用于模型训练,包含 1514.5 小时的高频 ICP 波形数据,经处理后分割为 401,654 个时段;数据集 2 用于泛化性测试,有 17 小时的高频 ICP 数据,分割为 2550 个时段;数据集 3 用于 “ground truth” 验证,包含 254 小时的 EVD 数据,分割为 67,506 个时段。通过分析发现,不同数据集的平均 ICP 值分布存在显著差异,反映了不同的临床状态。
  • 模型性能评估:经过一系列的训练和优化,XGBoost 模型在多个评估指标上表现出色。在数据集 1 中,模型的召回率为 0.986,阳性预测值为 0.975,ROC 曲线下面积(AUC ROC)为 0.991,F1 分数为 0.980;在数据集 2 中,虽然性能有所下降,但仍保持一定的准确性,召回率为 0.871,阳性预测值为 0.868,AUC ROC 为 0.894,F1 分数为 0.869;在数据集 3 中,模型保持平衡的性能,召回率为 0.853,阳性预测值为 0.977,AUC ROC 为 0.925,F1 分数为 0.900。这表明模型在不同数据集上具有较好的泛化性和准确性。
  • 特征重要性分析:通过计算特征重要性和 SHAP(SHapley Additive exPlanations)分析,发现 15 - 18Hz(PSD)、0 - 3Hz(PSD)和稳健标准差(Robust Std Dev)等特征对模型决策影响较大。例如,较低的 15 - 18Hz 和 1Hz 频段的 PSD 值与夹紧状态的 ICP 输出可能性较高相关,而稳健标准差和平均低频成分(如 0 - 3Hz 和 1 - 2Hz)在模型决策过程中起着重要作用。

研究结论和讨论部分指出,该研究成功开发并验证了 CICL(Classification of ICP epochs using a machine Learning framework)这一创新的半监督机器学习框架。它能够高效地对急性脑损伤患者 EVD 产生的 ICP 波形进行预处理,准确区分准确的夹紧信号、不准确的引流信号和噪声伪影。这一成果具有多方面的重要意义。首先,为开发预测 ICP 升高的机器学习模型奠定了基础,有助于在危机发生前采取预防措施,减少继发性脑损伤,潜在地使每年数万名患者受益。其次,该框架为标注和准确识别其他生理参数提供了新思路,对临床管理急性脑损伤患者具有重要价值。此外,CICL 框架的半监督标注和训练方法具有创新性,可应用于其他生理时间序列数据的处理。然而,研究也存在一些局限性,如患者数据仅来自同一医疗系统的两家医院,可能存在地域和人群的局限性;EVD 在使用过程中可能存在未准确调平的情况,影响数据准确性;标注方法可能存在主观偏差。未来的研究将聚焦于多中心数据的前瞻性收集,进一步验证模型的泛化性和稳健性,同时探索 CICL 在其他 ICP 监测设备中的应用,拓展其应用范围。

总的来说,这项研究为急性脑损伤患者 ICP 监测和管理带来了新的希望和方法,虽然还有一些需要完善的地方,但无疑为该领域的发展指明了方向,有望推动精准医学在神经重症监护领域的进一步发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号