利用跨度和文档级特征分类从荷兰非结构化超声心动图报告中提取诊断信息的重要成果

【字体: 时间:2025年03月08日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  为解决临床标签提取难题,研究人员开展从荷兰超声心动图报告提取诊断信息研究,发现 SpanCategorizer 和MedRoBERTa.nl性能出色,有重要意义。

  在医疗领域,电子健康记录(EHR)中蕴含着大量有价值的信息,对临床机器学习应用极为关键。然而,目前从这些记录中提取准确临床标签却困难重重。一方面,结构化数据收集起步较晚,大量历史数据被闲置;另一方面,已收集的结构化数据存在精度和可靠性不足的问题,比如国际疾病分类(ICD)编码在电子健康记录的表型分析中就被认为不可靠。
超声心动图作为常用的心脏成像诊断手段,其报告中的数据在患者护理和临床试验中都有重要应用。但这些报告格式多样,还包含大量医学专业特点,如大量简写、专业词汇、隐含知识以及拼写和语法错误,这使得提取准确标签变得极具挑战性。以往人工提取标签的方式不仅成本高,而且耗时久,而基于规则的文本挖掘方法虽然有一定优势,但也存在无法泛化等缺点。因此,探索更有效的自动提取方法迫在眉睫。

荷兰乌得勒支大学医学中心(University Medical Center Utrecht)的研究人员 Bauke Arends、Melle Vessies 等人开展了一项研究,旨在测试从非结构化荷兰超声心动图报告中自动进行跨度和文档级诊断提取的可行性。该研究成果发表在《BMC Medical Informatics and Decision Making》上。

研究人员使用了多种关键技术方法。首先,他们收集了 115,692 份 2003 年至 2023 年乌得勒支大学医学中心在日常临床护理中产生的非结构化超声心动图报告作为研究数据。在数据标注方面,随机选取部分报告,由医生手动标注 11 种常见心脏特征的出现情况和严重程度,并通过多轮检查和培训确保标注质量。对于跨度分类,采用了近似列表查找(ALL)、MedCAT 和 spaCy SpanCategorizer 三种方法;在文档分类上,则运用了包括词袋模型(BOW)、SetFit、MedRoBERTa.nl等六种方法。最后,通过计算加权和宏观 F1 分数、精度和召回率等指标来评估模型性能。

研究结果如下:

  • 跨度分类:SpanCategorizer 在大多数特征的跨度分类任务中,加权和宏观 F1 分数最高。不过,ALLrule在分类瓣膜疾病时表现出色,这可能是因为瓣膜疾病常用简短、独特的短语描述。而 MedCAT 由于跨度建议不够完善,导致其精度和召回率较低。
  • 文档分类MedRoBERTa.nl在文档分类任务中,加权和宏观 F1 分数、精度和召回率均优于其他模型。间接文档分类的性能欠佳,凸显了直接文档分类模型的优势。SetFit 使用约 10% 的样本就取得了不错的效果,基于 RobBERTv2 模型的句子嵌入表现优于 BioLORD-2023M 模型。此外,减少标签集能显著提升文档分类模型的性能,仅包含特征存在与否的简化标签集甚至能得到近乎完美的结果。

研究结论和讨论部分指出,SpanCategorizer 和MedRoBERTa.nl分别在跨度和文档级诊断提取中表现卓越,为荷兰临床环境下的诊断信息提取提供了有效工具,且这两个模型可通过 HuggingFace 公开获取,方便相关人员使用。在数据有限的情况下,SetFit 是文档分类的合适替代方法。同时,研究也存在一些局限性,如仅使用了单一的训练 / 测试分割,可能导致过拟合,且性能估计可能偏乐观。未来研究可考虑在外部机构进行验证、采用集成建模或扩展到其他心脏特征的研究。

总的来说,这项研究为从荷兰非结构化超声心动图报告中提取诊断信息提供了重要的方法和思路,有助于推动临床自然语言处理在医学领域的应用,对提高医疗数据的利用效率和医疗决策的准确性具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号