利用自然语言处理和随机森林技术,机器学习显著提升了急性心力衰竭表型预测的准确性

《Frontiers in Artificial Intelligence》:Machine learning enhanced acute heart failure phenotype prediction using natural language processing and random forest

【字体: 时间:2025年10月17日 来源:Frontiers in Artificial Intelligence 4.7

编辑推荐:

  心力衰竭表型分类研究采用随机森林模型整合MIMIC-III数据库中的结构化实验室数据与非结构化临床文本,通过LASSO特征选择筛选100个关键特征(文本47个+实验室53个),验证组合数据模型在早期急性HF表型预测中最佳性能(训练集准确率70±3%,AUROC 0.76±0.02),独立测试集性能稳定(准确率73%,AUROC 0.80),且特征缩减至20个时仍保持较高预测能力。本研究为临床提供多模态数据驱动的早期表型分类工具,支持精准治疗决策。

  心力衰竭(Heart Failure, HF)作为一种复杂的临床疾病,已经成为全球范围内的重大公共卫生问题。根据世界卫生组织的数据,HF影响了大约6400万人,其高发病率、高死亡率以及沉重的医疗负担,使得早期诊断和精准治疗变得尤为重要。HF的临床表现多样,主要分为三种类型:左心室射血分数降低型心力衰竭(HFrEF,LVEF≤40%)、左心室射血分数中间型心力衰竭(HFmrEF,LVEF在40%至49%之间)以及左心室射血分数保留型心力衰竭(HFpEF,LVEF≥50%)。这三种类型在病理机制、治疗策略和预后方面存在显著差异,因此,准确识别HF的具体亚型对于制定个体化治疗方案具有重要意义。

随着医学技术的发展,特别是机器学习(Machine Learning, ML)和自然语言处理(Natural Language Processing, NLP)的广泛应用,为HF的早期诊断和分类提供了新的可能性。传统的HF分类依赖于心脏超声检查(如左心室射血分数的测定),但这一过程通常在住院后期完成,可能延误了治疗时机。此外,由于心脏超声检查成本较高且需要专业操作,其在基层医疗中的应用受到一定限制。因此,探索基于临床文本和实验室数据的HF分类方法,成为提升诊断效率和优化治疗策略的重要方向。

本研究旨在利用随机森林(Random Forests, RF)算法,结合临床文本和实验室数据,对急性HF(Acute Heart Failure, AHF)的三种主要亚型进行分类。研究采用MIMIC-III数据库作为数据来源,该数据库包含大量重症监护病房(ICU)患者的临床信息,涵盖人口统计学数据、生命体征、实验室检查结果、影像报告以及治疗记录等。尽管该数据库主要面向ICU患者,但其丰富的数据内容使其成为HF研究的理想资源。

为了确保研究的代表性,本研究仅纳入首次诊断为HF的患者,排除了后续的重复住院记录。最终的训练数据集包含1,192例患者,验证数据集包含513例患者。研究团队通过LASSO方法对临床文本和实验室数据进行了特征选择,以识别最具预测价值的变量。文本特征被转换为结构化数据,采用one-hot编码方式处理。同时,为避免心脏超声数据对模型训练的潜在偏倚,研究者在训练过程中排除了所有与心脏超声相关的数据,包括护理记录和出院摘要中的相关描述。

在模型构建方面,研究团队分别训练了三种类型的随机森林模型:仅基于文本数据、仅基于实验室数据以及结合文本与实验室数据的混合模型。通过计算模型在训练集和验证集上的性能指标,如准确率(Accuracy)、受试者工作特征曲线下面积(AUROC)和精确率-召回率曲线下面积(AUPRC),评估了不同数据配置对模型性能的影响。结果显示,结合文本和实验室数据的模型在整体分类效果上优于单独使用文本或实验室数据的模型。在训练数据集上,结合数据的模型准确率为0.70±0.03,AUROC为0.76±0.02,而在独立验证数据集上,该模型的准确率进一步提升至0.73,AUROC达到0.80,表明模型具有良好的泛化能力。

进一步的分析表明,即使将特征数量减少到20个,模型的性能仍然保持较高水平,准确率和AUROC均未出现明显下降。然而,当特征数量进一步减少至10个时,模型的准确率显著下降,仅为0.54±0.01,AUROC也降至0.64±0.02。这表明,虽然模型在减少特征数量后仍能保持一定的预测能力,但特征数量的减少会影响其对HF亚型的区分能力。因此,模型的构建需要在准确率和计算效率之间取得平衡,确保在实际临床应用中既高效又可靠。

在特征重要性分析中,研究团队利用SHAP(SHapley Additive exPlanations)方法对模型的关键特征进行了可视化分析。结果显示,“hypokinesis”(心肌收缩减弱)、“cardiomyopathy”(心肌病)、“severe global dysfunction”(严重整体功能障碍)等文本特征对HFrEF的预测具有显著影响。这些术语通常出现在临床记录中,用于描述患者的心脏功能状态。例如,“hypokinesis”可能提示心肌收缩力下降,而“cardiomyopathy”则可能指向心肌结构或功能的异常。此外,实验室数据中的某些指标,如血红蛋白水平、血细胞比容以及白细胞计数等,也被证明对HF亚型的分类具有重要价值。例如,HFrEF患者的血红蛋白水平通常高于HFpEF和HFmrEF患者,这可能与HFrEF患者更常见的慢性炎症状态和铁缺乏有关。

通过进一步的模型优化,研究团队发现,在特征数量减少至50个的情况下,模型的性能仍然保持较高水平。这一结果表明,即使在减少数据维度的情况下,模型仍能有效地捕捉HF亚型的关键特征,从而支持早期诊断和干预。这种高效且精准的分类方法,不仅有助于改善患者预后,还可能为临床医生提供更有力的决策支持。

此外,本研究还探讨了不同HF亚型的预测难度。结果显示,HFrEF的预测性能最高,其AUROC为0.86,而HFmrEF的预测性能相对较低,仅为0.70。这可能与HFmrEF的病理机制复杂性有关,其表现为收缩和舒张功能的双重异常,使得特征提取和分类变得更加困难。因此,未来的研究需要进一步探索HFmrEF的潜在生物标志物或临床特征,以提高其预测准确性。

本研究的成果为HF的早期诊断和分类提供了新的思路和方法。通过结合临床文本和实验室数据,研究团队开发出一种高效且可解释的随机森林模型,能够准确识别AHF的三种主要亚型。这种模型不仅在训练数据集上表现出色,而且在独立验证数据集上也保持了较高的泛化能力。此外,模型的可解释性分析表明,关键特征对HF亚型的预测具有明确的临床意义,这为医生理解模型的决策过程提供了依据。

然而,研究也指出了一些局限性。首先,MIMIC-III数据库主要来源于ICU患者,可能无法完全反映社区或门诊患者的情况。因此,未来的研究需要在更广泛的患者群体中进行验证,以确保模型的适用性和推广性。其次,尽管模型在训练过程中排除了心脏超声数据,但在实际临床应用中,仍然需要考虑如何整合多种数据源,以进一步提高预测的准确性。最后,研究团队发现,由于数据集中的类别不平衡问题,模型的精确率和召回率相对较低,这提示在未来的模型优化中,需要引入更有效的数据平衡策略,以提高对少数类别的识别能力。

总体而言,本研究通过结合临床文本和实验室数据,开发出一种适用于急性HF亚型分类的随机森林模型。该模型在训练和验证阶段均表现出良好的性能,且具备较高的可解释性,有助于临床医生在早期阶段做出更精准的诊断和治疗决策。随着人工智能技术的不断发展,未来有望将更多先进的算法和数据处理方法应用于HF的预测和分类,从而进一步推动个性化医疗的发展,提高患者的整体治疗效果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号