
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于护理数据的机器学习模型预测高危出院患者再入院风险:一项回顾性研究
【字体: 大 中 小 】 时间:2025年06月06日 来源:JMIR Medical Informatics 3.1
编辑推荐:
本研究针对非计划再入院增加医疗成本及降低护理质量的问题,开发了基于护理数据的机器学习预测模型。研究人员利用韩国首尔某三甲医院12,977例高危疾病患者的电子病历数据,构建了早期(入院1天内)和全程住院两种预测模型(Model 1和Model 2)。结果显示,随机森林(AUROC=0.62)和CatBoost(AUROC=0.64)模型性能最优,BMI、收缩压和年龄是关键预测因子。该研究为临床早期干预提供了数据支持,凸显了护理数据在风险分层中的价值。
医院非计划再入院是医疗系统面临的重大挑战,不仅推高医疗成本(美国年耗资260亿美元),还影响患者预后。韩国三级医院30天再入院率高达30%,但传统统计模型因变量复杂性和样本量限制,预测精度不足。更棘手的是,现有干预多集中于出院阶段,而早期风险评估工具的缺失导致错失干预良机。在此背景下,韩国Severance Hospital的研究团队开展了一项创新研究,通过整合护理数据与机器学习技术,构建了可早期预警再入院风险的预测模型,成果发表于《JMIR Medical Informatics》。
研究团队采用5种算法(逻辑回归、随机森林、决策树、XGBoost、CatBoost)和5折交叉验证,对9028例高危患者(慢性阻塞性肺病、肝病等6类疾病)的电子病历进行建模。Model 1仅用入院24小时数据,Model 2纳入全程住院数据,并采用ADASYN算法处理数据不平衡问题。
研究结果
模型性能:Model 1中随机森林表现最佳(测试集AUROC=0.62),Model 2中CatBoost领先(AUROC=0.64)。值得注意的是,早期模型45%的重要变量来自护理数据(如病房严重程度、跌倒风险评估)。
关键预测因子:BMI、收缩压(SBP)和年龄在两个模型中均位列前三。Model 1特征重要性图显示,护理特有的沃德严重程度评分(ward severity)和健康行为习惯(health behavior habits)进入前50%。
数据价值:与仅依赖临床指标的Model 2相比,整合护理评估数据的Model 1在早期预测中展现出独特优势,证实了护士采集的身心社会多维信息的预测价值。
讨论与意义
该研究突破了传统预测模型的三重局限:时间上将风险评估窗口前移至入院初期;方法上采用自适应合成采样(ADASYN)解决样本偏差;数据源上首次系统整合护理评估指标。虽然模型性能(AUROC<0.65)仍有提升空间,但为临床提供了实用的筛查工具——通过简单测量BMI、血压等指标即可初步识别高风险患者。
实践层面,该模型支持两种创新应用:作为电子病历(EHR)嵌入式模块实现实时风险预警;为"以患者为中心"的护理计划提供数据支撑,例如对高跌倒风险患者提前加强康复训练。政策制定者可参考该模型优化资源分配,将有限干预资源精准投向高风险人群(预计可降低11-28%再入院率)。未来研究需扩大样本来源并探索跨院追踪技术,以进一步提升模型泛化能力。
生物通微信公众号
知名企业招聘