基于自然语言处理的急诊科文本标记物识别与卒中风险预测研究

【字体: 时间:2025年06月12日 来源:Journal of Stroke and Cerebrovascular Diseases 2.0

编辑推荐:

  为解决急诊科(ED)卒中漏诊导致的预后不良问题,研究人员通过自然语言处理(NLP)技术分析非神经科急诊病历,发现11种与30天内卒中住院显著相关的神经文本标记物(如"语言障碍"、"影像学检查"等),构建的弹性网络模型(AUC 0.74-0.75)具有跨中心验证效能,为早期识别高风险患者提供了数字化决策支持工具。

  

卒中作为全球致残致死的主要原因之一,每年造成巨大的医疗负担。尽管溶栓等治疗手段能显著改善预后,但急诊科(ED)环境中约10%的卒中患者面临漏诊风险,导致错失黄金救治窗口。更令人担忧的是,这些漏诊病例往往在就诊时已表现出神经系统症状,如头晕、语言障碍或意识改变,却因各种因素未能引起足够重视。这种诊断延迟不仅与患者不良结局直接相关,更暴露出当前急诊分诊系统对神经症状识别能力的不足。

为破解这一临床难题,芝加哥大学医学院和西北纪念医院的研究团队开展了一项创新性研究。研究人员另辟蹊径,采用自然语言处理(NLP)技术挖掘急诊病历中的"数字生物标志物",试图建立卒中风险的早期预警系统。这项发表在《Journal of Stroke and Cerebrovascular Diseases》的研究,首次系统性地证明了急诊文本数据对预测短期卒中风险的临床价值。

研究团队采用多中心回顾性队列设计,关键技术包括:1) 使用临床文本分析与知识提取系统(cTAKES)处理急诊病历,将文本映射为标准化医学概念(CUIs);2) 构建发现队列(UCM医院987例)与验证队列(NMH医院433例),前者采用年龄性别匹配的卒中-胃肠炎对照设计;3) 通过弹性网络模型筛选预测因子并评估跨中心效能。

【RESULTS】
【Patient Characteristics】
发现队列中51%为卒中病例,验证队列比例为24%。两组在种族构成上存在差异(发现队列89.8%为非裔美国人),但年龄性别分布相似,平均年龄约63岁,女性占比52-57%。

【Identification of Neurological Text Markers】
从2287个显著相关CUIs中,专家评审确定了58个神经概念,归类为11类文本标记物。其中7类涉及神经系统检查("协调性"、"颅神经"等),3类反映诊断过程("鉴别诊断"、"脑电图"等),1类关联卒中药物。标记物"语言障碍"在两组卒中患者中分别占25.1%和14.7%,"影像学检查"占比高达85%和73.5%。

【Validation of Neurological Text Markers】
弹性网络模型显示,10/11标记物在两组中保持一致的效应方向。最具预测力的5个标记依次为:"语言障碍"(OR最高)、"影像学检查"、"鉴别诊断"、"协调性"和"药物治疗"。模型跨中心验证AUC达0.74-0.75,校准良好(斜率1.26)。值得注意的是,"颅神经"标记物虽普遍存在(70%病例),但预测方向不一致。

【DISCUSSION】
这项研究开创性地证实,急诊病历中隐藏的神经文本标记物能有效预测短期卒中风险。其中"语言障碍"标记的强关联性特别值得关注,这与既往研究发现的失语症患者易被漏诊现象高度吻合。而"影像学检查"标记的高频出现则暗示,即便进行了头部CT/MRI检查,部分轻微卒中仍可能被忽视。

研究的临床转化价值主要体现在三方面:首先,建立的11项文本标记物可作为电子病历系统的自动筛查指标;其次,预测模型可整合到急诊分诊系统,对高风险患者触发神经科会诊;最后,该方法为其他急性疾病的早期识别提供了可借鉴的技术路线。

当然,研究也存在一定局限。回顾性设计无法完全排除混杂因素,且选择的胃肠炎对照组可能高估预测效能。未来需要在前瞻性队列中验证模型的临床效用,并探索将算法实时嵌入急诊工作流的可行性。这项研究的真正价值在于,它首次用数据证明:急诊医生的文字记录本身,就是预防卒中漏诊的"预警雷达"。通过深度挖掘这些日常医疗数据中隐藏的警示信号,我们或许能在患者出现不可逆损伤前,筑起一道数字化的"卒中防线"。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号