综述:重症监护病房(ICU)再入院预测模型的全面回顾:从统计方法到深度学习方法

【字体: 时间:2025年04月22日 来源:Artificial Intelligence in Medicine 6.1

编辑推荐:

  这篇综述聚焦 ICU 再入院预测模型,涵盖统计、机器学习(ML)和深度学习(DL)模型。分析了各类模型的特点、性能及应用挑战,探讨了数据处理、模型解释性等问题,并提出未来研究方向,为该领域发展提供了全面参考。

  

引言


重症监护病房(ICU)再入院是指患者出院后在短时间内非计划重返 ICU,发生率为 4%-14%,与较高的发病率、死亡率、更长住院时间和更高医疗成本相关。电子健康记录(EHR)数据为解决这一问题提供了资源,但数据复杂、缺失率高且结果类别不平衡。机器学习(ML)和深度学习(DL)算法在医疗领域有应用潜力,而此前的综述存在局限性,本文旨在全面回顾相关研究。

方法


遵循系统评价和荟萃分析的首选报告项目(PRISMA)框架,检索谷歌学术、PubMed、Compendex 和 Wiley Online Library 四个数据库中截至 2023 年 12 月的英文研究论文。依据人口、干预、比较和结果(PICO)框架筛选文献,最终纳入 66 篇论文,并使用预测建模研究的批判性评价和数据提取清单(CHARMS)进行定量描述分析。

结果


  1. 特征表示技术:多数统计和 ML 模型主要使用人口统计学和时间数据,在处理复杂时间趋势、医学代码和文本数据时存在不足。DL 模型可自动学习特征,但面临数据稀疏、模态多样等挑战。自然语言处理(NLP)技术及图嵌入等方法有助于提升信息提取和模型性能,但仍需改进。
  2. 模型类型
    • 统计方法:包括逻辑回归(LR)、模糊聚类、动态线性模型(DLMs)和条件随机字段(CRF)等。LR 模型 AUC 为 62%-76%,模糊聚类模型 AUC 为 58%-81%,DLMs 模型 AUC 可达 93%,CRF 模型准确率最高达 90%,但这些模型受样本量小的限制。
    • 机器学习方法:如神经网络(NN)、支持向量机(SVM)、决策树(DT)、随机森林(RF)和提升技术等。NN 模型 AUC 为 64%-87%,SVM 模型 AUC 为 71%-74%,DT 和 RF 模型 AUC 为 59%-92%,提升技术模型 AUC 为 60%-92%。ML 模型性能随样本量增大可能下降,复杂模型更可靠。
    • 深度学习方法:如循环神经网络(RNN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)、Transformer、神经普通微分方程(ODEs)和图神经网络(GNNs)等。LSTM-CNN 模型 AUC 为 63%-82%,Transformer - 基于的模型 AUC 为 67%-84%,ODEs 模型 AUC 平均为 73%,图和知识 - 基于的模型 AUC 为 59%-85%。DL 模型虽有改进,但仍未达预期,NLP 和图方法可提升性能。

  3. 可解释性、模型校准和泛化:LR 模型可通过模型权重等方式解释,而模糊、ML、DL 和图模型解释性较差,常需借助后验解释方法,但这些方法存在局限性。模型校准可通过多种测试确保预测概率与实际相符。模型泛化需进行外部验证,部分模型在外部验证时性能下降,需重新训练。实际应用的模型需满足多项要求,但目前较少研究实现。

讨论


转移学习、集成学习、多任务学习等方法有潜力,但需进一步研究验证。预测 ICU 再入院面临诸多挑战,如公共数据库可用性和复杂性、数据质量差、患者群体异质性等。当前模型在性能、可扩展性、可解释性等方面存在不足,定义不一致、数据处理不当、评估指标不合理等问题影响模型效果和应用。

未来方向


需要跨学科合作,标准化 EHR 数据库设计和 ICU 再入院定义,改进数据提取和预处理。应关注时间序列数据增强技术,开发更先进的疾病网络模型,集成时间序列数据和医学笔记,开发实时应用模型并进行临床测试。

结论


预测 ICU 再入院面临数据和模型等多方面挑战,标准化数据库设计、统一再入院定义、使用先进模型及数据增强技术等可提高预测模型的准确性和可靠性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号