编辑推荐:
【编辑推荐】为优化医院手术床位资源配置,研究人员利用电子健康记录(EHR)数据,构建机器学习模型预测住院时长、手术量及床位利用率。结果显示,优化模型使 > 2 周预测 RMSE 从 43.1 降至 24.4,为围术期管理提供数据支撑。
手术床位是医院核心资源之一,其利用率直接影响医疗效率与患者安全。当前,外科床位管理面临多重挑战: elective 手术患者住院需求虽有规律可循,但急诊手术、门诊术后意外留观等突发情况常导致床位需求波动剧烈。对于创伤中心或收治复杂病例的医疗机构,患者并存病恶化等问题进一步加剧了床位资源的不确定性。床位不足可能延误患者救治、增加院内感染风险,而过度配置则导致资源浪费,影响医院经济效益。因此,精准预测手术床位利用率,成为优化手术室排班、平衡医疗资源供需的关键议题。
为解决这一难题,美国加州大学圣地亚哥分校(University of California, San Diego)的研究团队开展了一项基于机器学习的预测模型研究。该研究成果发表于《Journal of Medical Systems》,旨在通过整合电子健康记录(EHR)中的多维度数据,构建能够预测不同时间节点(>2 周、2 周内、当日)手术床位需求的模型,为医院运营管理提供科学依据。
研究方法
研究团队回顾性分析了 2022 年 7 月至 2023 年 6 月单中心 75,282 例手术患者的 EHR 数据,包含患者并存病(ICD-9/10 编码)、年龄、手术类型、ASA 分级等 35 项特征。研究采用两阶段建模策略:首先分别构建随机森林(Random Forest)模型预测术后住院时长(Length of Stay, LOS),以及季节性自回归整合移动平均模型(SARIMA)预测每日手术量;随后将两者预测结果输入SARIMAX 模型,结合医院假期等外生变量,最终输出床位利用率预测值。数据按时间划分为训练集(前 32 周)、验证集(中间 10 周)和测试集(最后 10 周),以均方根误差(RMSE)评估模型性能。
研究结果
1. 住院时长预测模型
通过对 57,680 种并存病进行 ** 截断奇异值分解(Truncated Singular Value Decomposition)** 降维,提取 12 个主成分特征,随机森林模型实现了对住院时长的有效预测,RMSE 为 5.02 天。模型关键特征包括手术类型、平均住院时长、并存病主成分等,其中计划住院手术和手术平均住院时长的重要性排名靠前。
2. 每日手术量预测模型
SARIMA 模型结合 7 天周期性特征及医院假期变量,成功捕捉到手术量的季节性规律。优化后的SARIMAX (0,0,0)(0,1,1) 7 + 假期模型在测试集上的 RMSE 为 15.69,表明其对手术量波动的预测精度较高。
3. 床位利用率预测模型
针对不同时间节点的预测显示:
- >2 周预测:SARIMAX (0,0,0)(0,1,1) 7 + 假期模型的 RMSE 从基线 43.08 降至 24.38,降幅达 43.4%;
- 2 周内预测:引入 7 天滞后手术量的 SARIMAX 模型 RMSE 为 24.77,较基线(42.59)改善显著;
- 当日预测:整合预测住院时长的 SARIMAX 模型 RMSE 低至 22.67,若已知当日出院计划,RMSE 可进一步降至 22.67,误差率仅 2.4%。
研究结论与意义
本研究构建了首个整合住院时长与手术量的机器学习预测框架,通过特征工程(如并存病降维)与时间序列建模(SARIMA/SARIMAX)的结合,显著提升了不同时间尺度的床位利用率预测精度。研究结果表明,机器学习模型能够有效捕捉手术资源需求的动态规律,尤其在引入假期、手术类型等外生变量后,模型泛化能力增强。
该研究为医院围术期管理提供了新工具:长期预测可辅助手术室排班与设备调配,短期预测则支持实时床位动态调整。尽管单中心数据限制了模型通用性,但其提出的 “数据预处理 - 分阶段建模 - 多变量整合” 方法论,为其他医疗机构开发定制化预测模型提供了参考。随着 EHR 数据的积累与算法优化,此类模型有望成为医院精细化管理的核心组件,助力提升医疗资源利用效率,降低运营成本,最终改善患者预后。