
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型和机器学习算法的儿科影像检查爽约与超长候诊时间预测研究
【字体: 大 中 小 】 时间:2025年09月04日 来源:Frontiers in Artificial Intelligence 4.7
编辑推荐:
这篇综述系统评估了6种机器学习模型(XGBoost/RF/SVM/LR/ANN/LLM)在预测儿科影像检查爽约(no-show)和超长候诊时间(>1小时)中的表现,创新性地将临床BERT大语言模型(ClinicalBERT LLM)应用于异构医疗数据,证实检查优先级(WTIS-Priority)和检查原因(reason for exam)等情境特征比患者人口统计学特征更具预测价值,为开发公平性优化的智能排程系统提供了关键算法基础。
医疗爽约(no-show)和超长候诊时间已成为全球医疗系统面临的持续性难题。加拿大多伦多病童医院(SickKids)每月约3,000例磁共振成像(MRI)、超声(US)和计算机断层扫描(CT)检查中,即使2%的爽约率也会造成重大资源浪费。本研究首次系统比较了6类算法在儿科影像检查中的预测效能,特别探索了大语言模型(LLM)在整合非结构化临床文本(如检查原因)方面的突破性应用。
数据特征:
清洗后的154,935例检查数据包含20个关键特征,涵盖患者人口统计学(如邮政编码推断的家庭收入、单亲家庭比例)和检查相关参数(如WTIS优先级、麻醉类型)。创新性地通过加拿大统计局2021年人口普查数据增强地理特征,并利用哈弗辛公式计算患者居住地与医院的距离。
算法创新:
传统模型:XGBoost和随机森林(RF)采用10:1的类别权重处理数据不平衡(爽约率仅1.8%),通过网格搜索优化超参数。
深度学习:人工神经网络(ANN)设计自定义损失函数,赋予假阴性3倍权重以降低漏诊风险。
LLM突破:将结构化数据转化为自然语言描述(如"10岁女性患者预约下午3点腹部超声,既往有爽约史"),加载临床BERT预训练权重进行微调。
伦理设计:
为避免算法偏见,特别对比了含/不含人口统计学特征的模型表现,发现检查情境特征的预测贡献度达64%,显著高于收入等敏感特征(仅12%)。
性能对比:
爽约预测:XGBoost的AUC达0.96(F1=0.62),90%高风险阈值下精确度达78%
候诊预测:RF的AUC为0.83,而整合检查原因的BERT模型F1提升51%
关键发现:下午检查的爽约风险是早晨的13.9倍(p<0.05),MRI检查的候诊超时率达CT的2.4倍
特征解析:
XGBoost特征重要性分析显示:
WTIS优先级(权重0.38)
检查时段(0.21)
协调护理标志(CARE_COORDINATION_FLAG_YN,0.15)
而传统认为关键的邮政编码收入特征仅排第7位(0.09)
临床意义:
研究证实基于检查情境(如"疑似阑尾炎急诊超声")的预测模型,比依赖患者住址等人口统计学特征更公平可靠。校准后的XGBoost概率输出可直接用于风险分级:
高风险(>90%):启动超额预约
中风险(50-90%):增加短信提醒
低风险(<50%):常规流程
技术局限:
主要受限于EPIC系统数据缺陷:
爽约病例的预约提前期(lead time)被系统重置为0
仅34%的爽约记录包含有效检查原因描述
未来方向:
建议开发多模态融合模型,结合天气数据、交通实时信息等外部特征,并探索GPT-4等生成式AI在医疗预约文本理解中的应用潜力。
生物通微信公众号
知名企业招聘