基于大语言模型GPT-4o的电子健康记录卒中分型智能识别研究

【字体: 时间:2025年09月02日 来源:Stroke

编辑推荐:

  为解决电子健康记录(EHR)中卒中分型依赖人工审核的难题,来自UT Southwestern Medical Center的研究团队开发了基于GPT-4o的检索增强生成框架,在4123例卒中住院病例中验证显示:对卒中类型(缺血性/出血性)分类准确率达98%(95%CI 0.97-0.99),缺血性亚型识别中小血管闭塞敏感性达0.95,零样本思维链提示策略表现优异,为临床决策支持系统开发提供新范式。

  

在卒中监测领域,《国际疾病分类第十版》(ICD-10)编码虽能识别卒中事件,但电子健康记录(EHR)中结构化数据的局限性使得精确划分卒中类型及亚型仍具挑战性。这项创新性研究构建了基于GPT-4o大语言模型的检索增强生成(Retrieval-Augmented Generation, RAG)框架,以美国心脏协会"遵循指南-卒中"(Get With The Guidelines–Stroke)注册数据为金标准,系统评估了该模型从非结构化临床文本中识别卒中类型(缺血性vs出血性)及缺血性卒中亚型的能力。

研究团队采用三阶段验证策略:模型开发阶段使用20%的UT西南医学中心临床数据,剩余80%用于测试,并在帕克兰医院系统进行外部验证。纳入2019年1月至2023年8月期间4123例卒中住院病例,创新性地对比了零样本思维链(Zero-shot Chain-of-Thought)、专家引导和指令基础三种提示策略的性能表现。

令人振奋的是,在外部验证集中,GPT-4o对卒中类型的整体分类准确率高达98%(95%CI 0.97-0.99),敏感性0.98,特异性0.97。在更具挑战性的缺血性卒中亚型识别中,模型对小血管闭塞(Small-vessel occlusion)的识别表现出色(敏感性0.95,95%CI 0.93-0.97),但对隐源性(Cryptogenic)卒中的识别仍有提升空间(敏感性0.40)。值得注意的是,无需人工标注的零样本思维链策略与更耗时的专家引导策略表现相当,且重复查询一致性>99%,展现出卓越的稳定性。

这项研究首次证实了GPT-4o在卒中分型自动化处理中的临床应用潜力,其突破性在于将自然语言处理技术成功应用于复杂神经血管疾病的分类决策,为减轻临床文档审核负担提供了智能化解决方案。未来研究可进一步优化模型对少见卒中亚型的识别能力,推动人工智能在神经病学精准医疗中的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号