基于CT/MRI影像报告的精细调优大语言模型在急性脑梗死早期识别中的应用研究

【字体: 时间:2025年06月03日 来源:Emergency Radiology 1.7

编辑推荐:

  为解决急性至亚急性脑梗死的自动化识别难题,日本国立全球健康医学中心与东京大学团队开展了一项利用精细调优大语言模型(LLM)解析CT/MRI影像报告的研究。通过5,573例训练数据验证,模型对三类分组(新发急性梗死/已知梗死/无梗死)的宏敏感度达0.918,AUC值0.979,单例预测仅需0.115秒。该研究为构建卒中早期预警系统提供了高效NLP解决方案,发表于《Emergency Radiology》。

  

卒中作为全球第二大死因,其早期识别直接影响患者预后。尽管MRI和CT是诊断脑梗死的金标准,但临床实践中大量非结构化的放射学报告可能导致关键病例被遗漏。传统自然语言处理(NLP)技术难以精准区分急性、亚急性与慢性梗死,而人工审核又面临效率瓶颈。这一矛盾促使日本国立全球健康医学中心联合东京大学的研究团队探索基于大语言模型(LLM)的自动化解决方案。

研究团队采用三阶段实验设计,从2019-2024年间收集8,290例含"脑梗死"关键词的日文报告,按时间划分为训练集(5,573例)、验证集(1,883例)和测试集(834例)。通过日本版BERT模型(cl-tohoku/bert-base-japanese)进行15轮精细调优,重点优化对三类报告的区分能力:新发急性至亚急性梗死(Group 0)、已知梗死或陈旧性梗死(Group 1)以及无梗死(Group 2)。关键技术包括基于注意力的序列分类架构、类别不平衡处理(Group 1/2欠采样至各500例),以及ROC曲线评估模型判别效能。

模型性能验证
在独立测试集中,最优模型展现出卓越的鉴别能力:对新发梗死(Group 0)的敏感度达0.891,显著高于既往研究。特别值得注意的是,模型对MRI报告的识别性能(AUC 0.975)与CT报告(AUC 0.988)无统计学差异(p>0.05),证实其多模态适应性。宏敏感度(0.918)与准确率(0.923)指标显示,该模型较传统规则式NLP系统有显著提升。

时效性突破
模型单例预测耗时仅0.115±0.037秒,较人工审核效率提升约200倍。这种实时处理能力使其可无缝接入医院PACS系统,实现"扫描完成-报告生成-风险预警"的闭环管理。但研究者也指出,30例假阳性(FDR 0.380)提示需进一步优化以减少临床误报。

临床转化价值
该研究首次证实LLM在卒中分期的精准识别潜力:

  1. 为静脉溶栓和血管内治疗争取黄金时间窗
  2. 辅助判断双抗治疗(阿司匹林+氯吡格雷)的适用阶段
  3. 自动化筛选临床研究队列,加速循证医学证据积累

讨论部分强调,这种基于Transformer架构的解决方案突破了传统NLP的规则限制,通过12层注意力机制捕捉日文放射学报告中的细微语义差异。尽管存在数据集单一性的局限,但时间外部验证的设计增强了结论可靠性。研究者建议下一步整合多中心数据,并探索多语言适配可能。

这项发表于《Emergency Radiology》的研究,为人工智能在神经放射学的落地应用树立了新范式。其价值不仅在于技术指标的突破,更在于构建了从算法研发到临床警示系统的完整通路,为全球卒中防治提供了可复制的技术蓝图。随着LLM在医疗领域的深度渗透,此类"AI哨兵"系统或将重塑急重症诊疗流程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号