基于年龄、ADA 和 LDH 的机器学习诊断模型:精准破解胸腔积液病因之谜

【字体: 时间:2025年05月04日 来源:Respiratory Research 4.7

编辑推荐:

  胸腔积液病因诊断是临床难题,传统方法存在局限。研究人员开展基于机器学习(ML)的胸腔积液病因诊断模型研究,纳入 742 例患者数据构建 6 种模型。结果显示模型诊断效果良好,ADA 是重要特征。该研究为临床诊断提供新途径。

  在医学领域,胸腔积液是一种常见病症,就像身体里的 “小麻烦”,它指的是胸腔内积聚了过多液体。有效管理胸腔积液的关键在于准确识别其潜在病因,常见病因包括充血性心力衰竭、肺炎和癌症等 。然而,现有的诊断方法却存在诸多问题。比如,胸腔穿刺术虽被广泛用于诊断胸腔积液,但对恶性胸腔积液(MPE)的诊断准确性差异很大;在结核病高发地区,结核性胸腔积液(TPE)占比大,而传统的 Light 标准会将约 25% 的漏出液误判为渗出液;诊断类肺炎性胸腔积液(PPE)也颇具挑战,因为缺乏明确的诊断标准。此外,一些侵入性检查,像胸膜针刺活检和胸腔镜检查,虽然能提供明确的病理诊断,但存在并发症风险,还依赖病理学家的经验,且耗时较长。所以,急需新的诊断工具来解决这些问题。
为了攻克这些难题,首都医科大学附属北京朝阳医院的研究人员展开了一项极具意义的研究。他们构建了基于机器学习(ML)的诊断模型,旨在更高效、准确地判断胸腔积液的病因,这一研究成果发表在《Respiratory Research》上。

研究人员采用了多种关键技术方法。首先,进行回顾性研究,收集了 2014 年 1 月至 2024 年 5 月北京朝阳医院收治的胸腔积液患者数据 ,排除病因不明、临床数据不全等情况后,最终纳入 742 例患者。然后,选取年龄、胸腔积液腺苷脱氨酶(ADA)和乳酸脱氢酶(LDH)作为特征。将数据集按 7:3 的比例分为训练集和测试集,运用 6 种机器学习算法(多项逻辑回归(LR)、支持向量机(SVM)、极端梯度提升(XGBoost)、随机森林(RF)、K 近邻(KNN)和表格变换器(TabTransformer))构建诊断模型,并使用贝叶斯优化调整模型超参数。同时,以传统诊断方法作为对照进行评估。

下面来看具体的研究结果:

  • 基线信息:研究共纳入 742 例患者,其中恶性胸腔积液占 53.5%,结核性胸腔积液占 34.1% 。对年龄、ADA 和 LDH 的分析发现,ADA 水平与年龄呈负相关,LDH 与 ADA 呈强正相关,且这些特征在不同病因组间差异显著。
  • 模型性能评估:6 种模型在训练集和测试集上均表现良好,XGBoost 和 RF 模型准确率较高,均超 0.820 。所有模型对 MPE、TPE 和漏出液的分类 AUC 值均超 0.890,但对 PPE 分类的 AUC 值约为 0.700 。进一步分析发现,XGBoost 和 RF 在诊断 MPE 方面表现更优,KNN 和 TabTransformer 对 TPE 诊断效果更好,且 6 种模型均优于传统诊断方法。
  • 特征对模型预测的影响:通过 XGBoost 模型的增益和 RF 模型的基尼系数平均减少量评估特征重要性,发现 ADA 重要性最高,其次是 LDH 和年龄 。随机森林模型的首棵决策树可视化结果显示,模型先依据 ADA 水平进行分裂,接着是 LDH 和年龄。XGBoost 模型的部分依赖图表明,ADA 对 TPE 预测影响大,年龄对 MPE 和 TPE 预测趋势不同,LDH 在 MPE 中升高,在其他类型胸腔积液中下降。

在研究结论与讨论部分,研究表明基于年龄、ADA 和 LDH 构建的机器学习模型在胸腔积液病因诊断方面表现出色,尤其是对 MPE、TPE 和漏出液的诊断 。这一成果为临床医生识别胸腔积液病因提供了有力工具,有助于提高诊断效率,减少不必要的检查和侵入性操作。不过,该研究也存在一定局限性,如数据来自单中心,部分类型胸腔积液病例数有限等。未来还需更多研究,纳入更具代表性和多样性的数据集,进一步优化预测模型。总体而言,这项研究为胸腔积液的诊断开辟了新方向,有望推动临床诊断技术的进步,造福更多患者。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号