基于机器学习的急诊分诊预测模型开发:利用XGBoost算法优化患者优先级、入院及病区分配决策

【字体: 时间:2025年07月30日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  本研究针对急诊科(ED)分诊决策的高不确定性问题,开发了基于XGBoost算法的两阶段预测模型。通过整合马尔他Mater Dei医院6年65万例急诊数据,研究人员构建了可预测急诊严重指数(ESI)分级、住院概率及收治病区的机器学习系统。结果显示,模型在第二阶段(加入血红蛋白、C反应蛋白等关键血液指标后)表现显著提升:优先级预测准确率从0.75升至0.76,入院预测准确率从0.80升至0.82,病区分类准确率达0.86。该研究为急诊资源优化提供了数据驱动的决策支持工具。

  

急诊科(ED)作为医院最复杂的高风险区域,长期面临分诊决策压力大、资源分配不合理等挑战。传统分诊依赖护士经验判断,在拥挤环境下易出现优先级误判(53-82%的可预防不良事件与此相关)。尤其当患者病史未知时,仅凭短暂观察窗口做出的决策可能引发严重后果。马尔他Mater Dei医院与利物浦约翰摩尔大学的研究团队在《BMC Medical Informatics and Decision Making》发表的研究,通过开发两阶段机器学习模型,为这一临床痛点提供了创新解决方案。

研究采用极端梯度提升(XGBoost)算法,分阶段整合人口统计学特征(性别、年龄组、地域)和临床指标(血红蛋白、肌钙蛋白T等17项血液参数)。技术关键点包括:1) 使用SMOTE技术处理65万急诊记录中的类别不平衡;2) 通过五折分层交叉验证优化参数(学习率0.05,最大树深度8);3) 采用AUC-ROC和校准曲线双重评估模型可靠性。

预测患者优先级
通过两阶段建模,优先级分类的F1-score从0.64(仅基础数据)提升至0.65(加入实验室指标后)。特征重要性分析显示,血红蛋白结果(Haemoglobin_Result)和白细胞计数(White_Blood_Cell_Count_Result)在第二阶段贡献度分别达0.132和0.104,证实生化指标对分诊决策的增强作用。

预测患者入院
入院预测的宏观平均F1-score从0.77提升至0.80。值得注意的是,红细胞分布宽度(Red_Cell_Distribution_Width_Result)在第二阶段重要性跃升至0.201,成为仅次于主诉类别的第二关键特征,提示该指标对住院需求的强预测性。

预测收治病区
主病区分类准确率提升6个百分点至0.86,其中内科(Medicine)病例的召回率从0.54显著改善至0.74。子病区预测中,心脏科(Cardiology)的精确度从0.25跃升至0.42,证实实验室数据对专科分流的价值。校准曲线显示,第二阶段预测概率与实际观察值的偏差缩小,尤其在0.7-0.9高概率区近乎完美对齐。

该研究的创新性在于首次将全国性急诊数据集(覆盖马尔他全部人口)与动态临床指标相结合。模型部署后,可提前8-10小时预测住院需求,使床位准备时间从被动响应转为主动规划。讨论部分指出,虽然当前模型在"内科急性"(Medicine/Acute)等少数子类别的预测仍有提升空间(F1-score 0.17),但其整体表现已超越传统ESI分级体系。未来通过整合生命体征(如心电图ECG)和用药史,有望进一步突破急诊"数据孤岛"限制,为智能分诊系统树立新标杆。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号