
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型的临床主诉与病史信息提取流程在急诊患者病情严重程度评估中的应用研究
【字体: 大 中 小 】 时间:2025年07月15日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对急诊科(ED)早期识别危重患者的临床挑战,开发了一种基于大语言模型(LLM)的创新流程,通过整合提示模板、上下文学习(ICL)和检索增强生成(RAG)技术,从患者主诉和病史文本中提取病情严重程度评分(xtext)。研究团队利用中国急诊分诊评估治疗(CETAT)数据库27,187例患者数据验证显示,该流程在早期阶段(生命体征未获取时)使AUC-ROC从0.746提升至0.802,证实LLM能有效挖掘非结构化临床文本的预测价值,为急诊分诊决策提供新工具。
急诊科每天面临海量患者涌入,如何在资源有限的情况下快速识别危重病例是持续存在的临床难题。传统分诊主要依赖生命体征等结构化数据,但患者在入院初期往往缺乏这些关键指标。临床笔记中的主诉和病史文本虽蕴含丰富信息,却因非结构化特性难以被传统模型有效利用。随着ChatGLM-2、GLM-4等大语言模型(LLM)在自然语言处理领域展现强大能力,中国科学技术大学数学科学学院的研究团队创新性地将其引入急诊医学场景,开发了一套融合人工智能技术的临床文本分析流程。
研究团队构建的自动化流程包含三大核心技术:通过多选模板引导LLM输出结构化评估结果;采用上下文学习(ICL)提升模型推理稳定性;结合检索增强生成(RAG)匹配相似病例增强预测准确性。基于中国急诊分诊评估治疗(CETAT)数据库27,187例患者数据,团队验证了该流程在两种临床终点的预测效能:心肺复苏/死亡(D/C)和一级分诊(TL-1)。
方法学创新
研究采用留一法(LOO)验证策略,通过逻辑回归模型整合LLM生成的xtext评分与传统临床变量。技术关键包括:(1)使用GLM-4、Alpaca-2等LLM解析中文临床文本;(2)基于piccolo-large-zh嵌入模型实现病例相似度匹配;(3)通过Delong检验统计评估AUC-ROC改善程度。
关键发现
早期预测优势:在仅有人口统计学数据的阶段1-a,xtext使D/C预测的AUC-ROC从0.589显著提升至0.722(GLM-4),证实主诉文本的早期预警价值。
模型比较:GLM-4在多数场景优于Alpaca-2,如TL-1预测中AUC-ROC提升0.050-0.112,显示不同LLM的性能差异。
特征重要性:Shapley值分析揭示xtext的影响力超过部分生命体征(如收缩压、血氧饱和度),尤其在TL-1预测中排名靠前。
临床意义
该研究首次系统评估了LLM在急诊分诊中的应用潜力,其创新性体现在:(1)构建可解释的xtext评分体系,突破传统文本分析方法局限;(2)证实非结构化文本在早期风险分层中的独特价值;(3)为未来开发实时决策支持系统奠定基础。尽管在生命体征完备后(阶段2-b)改善幅度减弱,但研究强调"时间就是生命"的急诊核心理念——越早获取预测信息,越能改善临床结局。
论文发表于《Scientific Reports》时,审稿人特别指出该方法学框架的普适性优势:无需重新训练LLM参数,仅通过提示工程即可适配不同医疗场景。团队建议后续研究可探索LLM与深度学习模型的联合应用,并扩大至多中心验证,以进一步推动人工智能在急诊医学中的转化落地。
生物通微信公众号
知名企业招聘