基于大语言模型的端到端中文临床事件提取研究

【字体: 时间:2025年05月16日 来源:Scientific Reports 3.8

编辑推荐:

  临床事件提取对医疗数据结构化至关重要。针对传统管道方法的误差传播与信息丢失问题,研究人员开展基于大语言模型(LLMs)的端到端临床事件提取研究,提出 LMCEE 方法。实验表明其 F1 分数较传统方法提升 12%,优于 UIE,为医疗 NLP 提供新方向。

  
在医疗信息化浪潮中,临床数据的高效处理始终是智慧医疗发展的核心挑战。从堆积如山的电子病历中精准提取关键事件信息,如同在数据海洋中打捞珍珠,不仅需要敏锐的 “眼力”,更依赖先进的 “工具”。传统的临床事件提取方法采用管道式(pipeline)架构,将任务拆解为触发词识别、元素提取等多个独立环节,然而这种 “流水线” 模式如同多米诺骨牌,上游环节的微小误差会沿着流程层层放大,最终导致信息丢失与性能下降。尤其在中文临床场景中,医疗文本特有的专业术语密集、逻辑衔接隐式等特点,更让通用模型难以招架。如何突破传统方法的瓶颈,让机器真正 “读懂” 中文病历中的复杂语义?这成为横亘在医疗自然语言处理(NLP)领域的关键课题。

为攻克这一难题,中国社会科学院民族学与人类学研究所、同济大学医学院附属上海东方医院等机构的研究团队展开联合攻关。他们将目光投向近年来崭露头角的大语言模型(LLMs),试图借助其强大的上下文理解与生成能力,构建端到端的临床事件提取框架。这项研究成果发表在《Scientific Reports》上,为医疗数据智能化处理掀开了新的一页。

关键技术方法


研究团队提出的 LMCEE(Large Language Model-based Chinese Clinical Event Extraction)方法,核心在于将临床事件提取转化为文本生成任务,并设计了专业化的提示学习(prompt learning)模板。具体而言,研究采用 mT5、ChatGLM-6B 等预训练语言模型,通过半自动化方式构建包含事件属性的提示模板 —— 先由 LLM 生成初始模板,再经医学专家结合临床规范修订,确保模板贴合真实病历语境。此外,研究利用 30 亿 tokens 的医疗文本(涵盖电子病历、指南等)对模型进行领域适配,通过掩码语言模型(MLM)、下一句预测(NSP)等任务增强其医学语义理解能力。实验数据采用 CHIP-CDEE 数据集,包含 1971 份电子病历标注的 13905 个临床事件,分为训练集(1287 份)、验证集(300 份)和测试集(384 份)。

研究结果


1. 模型性能对比:端到端方案显著优于传统管道方法


在 CHIP-CDEE 数据集上,LMCEE 方法凭借 Prompt2 模板与 mT5 模型组合,取得了 66.8% 的 F1 分数,较传统管道方法(F1=54.4%)提升 12%,且超越基于生成的 UIE 模型(F1=61.1%)5.7%。多模板投票策略进一步将 F1 分数提升至 71.1%,显示出集成不同模板结果可有效过滤噪声预测。

2. 大语言模型选型:参数规模与训练任务的双重影响


对比不同 LLMs 发现,参数规模更大的模型表现更优:130 亿参数的 mT5 优于 62 亿参数的 ChatGLM-6B(F1=65.6%),而仅 3 亿参数的 Bert-large-chinese 性能最低(F1=58.1%)。值得注意的是,Promptclue 模型(77 亿参数)虽参数少于 mT5,但凭借多任务预训练,F1 分数达 66.3%,表明训练任务设计对模型能力有重要影响。

3. 领域数据增强:医疗文本预训练提升专业理解能力


对 mT5 进行医疗文本继续预训练后(命名为 mT5-med),F1 分数从 66.8% 提升至 67.5%,证实引入领域无监督数据可增强模型对医学术语和临床叙事的理解。在外部数据集泛化测试中,模型对不同地区医院的病历数据仍保持 67% 的 F1 分数,展现出较强的鲁棒性。

4. 误差分析:长文本与近义概念的处理瓶颈


尽管 LMCEE 表现优异,但其在长文本中存在事件漏检问题(如漏提 “瘀斑” 事件),且对邻近的近义触发词(如 “出血” 与 “ hemorrhage”)易合并识别,反映出注意力机制在复杂语境下的局限性。

研究结论与意义


这项研究首次将 LLMs 引入中文临床事件提取领域,通过端到端架构突破了传统管道方法的误差传播瓶颈,为医疗数据结构化提供了更高效的解决方案。实验证实提示模板设计、模型参数规模及领域数据预训练是影响性能的关键因素,其中医学专家参与的模板优化可显著提升事件识别的细粒度(如区分 “术后放疗” 与 “继发恶性肿瘤” 阶段)。研究同时揭示了 LLMs 在医疗 NLP 中的应用潜力与挑战 —— 尽管在小样本场景下展现出强大泛化能力,但长文本处理与语义细节辨别仍需进一步优化。

随着医疗大数据与 AI 的深度融合,LMCEE 这类方法有望成为构建临床事件图谱、辅助精准诊疗的核心技术,推动智能电子病历、临床决策支持系统等应用的落地。未来研究可进一步探索千亿级参数模型与更复杂提示策略的结合,为医疗语言理解打开新的想象空间。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号