基于大语言模型的结核性胸腔积液诊断新突破:开启精准医疗新篇章

【字体: 时间:2025年02月14日 来源:Respiratory Research 4.7

编辑推荐:

  为解决结核性胸腔积液(TPE)诊断难题,研究人员用大语言模型(LLM)构建诊断模型,其性能优异,意义重大。

  # 大语言模型为结核性胸腔积液诊断带来新曙光
在医学的神秘世界里,结核性胸腔积液(Tuberculous pleural effusion,TPE)就像一个难以捉摸的 “小怪兽”,给医生们带来了不少挑战。TPE 是肺结核常见的肺外表现形式,在许多国家,它是胸腔积液(Pleural effusion,PE)的主要病因之一,也是发展中国家突出的公共卫生问题。
传统的 TPE 诊断方法,比如胸膜活检和胸腔积液分析,就像是 “钝刀子割肉”,不仅敏感性有限,而且胸膜活检这种有创操作还会给患者带来痛苦和并发症风险,比如医源性气胸。另外,胸腔积液微生物培养耗时极长,有时需要长达八周才能出结果,这对于急需明确诊断、及时治疗的患者来说,无疑是漫长的等待。

随着人工智能(Artificial Intelligence,AI)时代的到来,机器学习在医疗领域逐渐崭露头角。不少研究尝试用机器学习算法(Machine learning algorithms,MLAs),像 k - 最近邻算法(k-Nearest Neighbors,KNN)、随机森林(Random Forests,RF)和支持向量机(Support Vector Machines,SVM)等构建 TPE 诊断模型,也取得了一些成果。但这些方法在处理复杂、多维的临床数据时,还是有点 “力不从心”,难以有效整合和分析数据。

在这样的背景下,来自九江学院附属医院、福建医科大学附属第二医院等机构的研究人员决心攻克这一难题。他们另辟蹊径,将目光投向了大语言模型(Large language model,LLM),尤其是 ChatGPT-4,希望借助其强大的数据分析能力,为 TPE 诊断带来新的突破。相关研究成果发表在《Respiratory Research》上。

研究人员开展了一项横断面研究,从九江学院附属医院 2011 年 1 月至 2024 年 6 月收治的 38885 例住院患者中筛选出 163 例符合条件的患者,其中 109 例为 TPE 患者,54 例为非 TPE 患者。研究人员从最初的 600 多个临床特征中筛选出 73 个变量进行分析。

在研究过程中,研究人员用到了多种关键技术方法。数据处理上,针对缺失值,根据不同数据类型采用 “norm”“logreg”“polyreg” 等方法进行插补;运用偏最小二乘法判别分析(Partial least squares discriminant analysis,PLS-DA)聚类数据,结合变量重要性投影(Variable importance projection,VIP)、受试者工作特征(Receiver operating characteristic,ROC)曲线分析等筛选变量。建模方面,使用 H2O AutoML 集成多种机器学习算法构建 TPE 机器学习诊断模型,运用五折交叉验证和自动超参数调整优化模型;构建传统逻辑回归模型,并采用多种策略进行变量选择;利用 ChatGPT-4 对变量进行重要性评分,构建 LLM 诊断模型。

临床特征分析结果


研究人员分析了 163 例患者的 73 个临床变量,发现临床特征在区分 TPE 和非 TPE 组方面具有很强的判别力。通过 PLS-DA 分析,发现前两个主成分(PC1 和 PC2)能解释一定比例的方差,两组在得分图上有明显分离。热图展示不同样本中临床特征的表达水平,结果显示 TPE 和非 TPE 组之间存在显著差异。进一步研究发现,胸腔积液中腺苷脱氨酶(Adenosine deaminase,ADA)水平、总蛋白分布以及血常规中单核细胞百分比等生物标志物在两组间差异显著,具有较高的诊断准确性。

机器学习模型诊断结果


研究人员通过一系列筛选最终确定 12 个变量用于进一步建模。利用 H2O 自动化机器学习平台创建了 453 个模型,结果显示多数模型表现出色。以最优的 XGBoost 模型为例,胸腔积液中的生化标志物,如白蛋白和 ADA,在区分 TPE 和非 TPE 组方面具有最强的诊断能力。SHAP 分析表明,胸腔积液中 “albumin =0” 对模型输出有最强的负面影响,而 “ADA = 1” 有显著的正面影响。模型在训练集和测试集上均表现出高灵敏度和特异性。

传统逻辑回归模型诊断结果


研究人员构建传统多元逻辑回归模型,通过逐步向前逻辑回归选择 12 个变量。森林图展示了各变量在诊断 TPE 中的作用,其中胸腔积液中的 ADA、白蛋白和碱性磷酸酶等变量具有重要意义。列线图为临床医生提供了便捷的诊断工具。ROC 曲线显示,该模型在训练集和测试集上的 AUC 较高,具有高诊断准确性和稳健性。决策曲线分析(Decision curve analysis,DCA)表明,在广泛的治疗阈值范围内,该模型比 “全治疗” 和 “不治疗” 策略具有更大的净效益。与其他已发表模型相比,该研究的逻辑回归模型表现更优。

大语言模型诊断结果


研究人员创新地使用 ChatGPT-4 和 ChatGPT-4o 评估其在 TPE 诊断中的性能。ChatGPT-4 对不同生化和血液学指标的重要性评分显示,胸腔积液中的生化标志物,尤其是 ADA 和总蛋白,以及血细胞分析中的中性粒细胞百分比和淋巴细胞计数具有较高重要性。与其他模型比较,ChatGPT-4o 和最佳机器学习模型(XGBoost)在各项指标上表现优异,ChatGPT-4 也展现出较强的诊断能力。研究人员还开发了 Python 包 “tpeai”,集成 ChatGPT-4 用于区分 TPE 和非 TPE 组,为临床诊断提供了有效支持。

研究结果表明,基于 LLM 的模型为 TPE 的早期非手术诊断提供了一种新颖、准确且具有成本效益的方法。与传统逻辑回归模型和常见机器学习算法相比,LLM 模型在敏感性、特异性等评估指标上表现更优。研究人员开发的 Python 包 “tpeai” 为临床医生提供了一个简单易用的工具,可根据基本生化和血液学数据快速生成诊断建议。

不过,该研究也存在一定局限性。样本量较小可能导致过拟合,影响模型的泛化能力;模型对特定生物标志物的依赖限制了其在不同地区的适用性;随机特征选择和模型复杂性增加了结果解释的难度。未来研究可以探索整合多模态数据,如基因组和成像信息,来提高诊断准确性,同时需要在更大的多中心数据集上进行验证,以确保模型的广泛适用性和稳健性。但无论如何,这项研究为 TPE 的诊断开辟了新的道路,随着人工智能技术的不断发展,LLM 在医疗领域的应用前景将更加广阔,有望为患者带来更精准、高效的医疗服务。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号