基于自然语言处理模型的放射学报告中脑转移瘤智能标注系统研发与验证

【字体: 时间:2025年09月01日 来源:Neuro-Oncology Advances 4.1

编辑推荐:

  针对脑转移瘤(BM)临床诊断工作量大、加拿大癌症登记系统漏报率高的问题,研究团队开发了基于BioBERT的双模型NLP算法,通过分析放射学报告中的"Findings"和"Impressions"章节实现BM自动标注。在阿尔伯塔省1585份测试报告中,集成模型准确率达94.3%,敏感度0.898,为大规模癌症筛查提供了高效工具。

  

在神经肿瘤学领域,脑转移瘤(Brain Metastases, BM)的临床管理面临严峻挑战。与原发性中枢神经系统肿瘤相比,BM的发病率高出数倍,每年约有10,000名加拿大患者被确诊,而官方癌症登记系统仅能捕获约28%的病例。这种巨大的诊断缺口使得医疗资源分配和流行病学研究都受到严重制约。传统的人工阅片方式不仅效率低下,在繁忙的临床工作中还容易出现漏诊。如何从海量放射学报告中快速、准确地识别BM病例,成为改善神经肿瘤诊疗的关键突破口。

发表在《Neuro-Oncology Advances》的这项研究创新性地将自然语言处理(NLP)技术引入神经放射学领域。研究团队以加拿大阿尔伯塔省2012-2019年确诊的癌症患者队列为基础,收集其截至2022年所有脑部/头部相关的放射学报告。通过人工标注1817份样本建立训练集,开发了基于BioBERT的双模型系统——分别解析报告的"Findings"(发现)和"Impressions"(印象)章节。当任一模型的预测概率超过设定阈值(0.4)时即判定为BM阳性。在包含1585份完整报告的测试集上,该集成系统展现出优异的性能指标。

关键技术方法包括:1)基于阿尔伯塔省癌症登记系统建立回顾性队列;2)人工标注构建BM标签数据集;3)采用BioBERT预训练模型分别针对放射学报告的不同章节进行微调;4)通过概率阈值集成实现最终预测。目前该模型正在安大略省的放射学报告中进行外部验证。

【数据来源与处理】

研究团队利用加拿大人口癌症登记数据,筛选出2012-2019年间确诊的癌症患者,追踪其至2022年的所有脑部影像学报告。这种基于真实世界数据的处理方法确保了研究结果的临床适用性。

【模型构建】

创新性地采用双BioBERT架构,分别针对放射学报告中专业性强但表述规范的"Impressions"章节和细节丰富但语言多变的"Findings"章节进行优化。这种分而治之的策略有效提升了模型对不同文本风格的适应能力。

【性能验证】

在独立测试集上,系统准确率达到94.3%,特别是展现出0.898的高灵敏度,这意味着它能有效识别绝大多数BM病例。虽然0.702的阳性预测值表明存在一定假阳性,但在筛查场景下确保不漏诊更为关键。

【推广应用】

作为首个针对加拿大人群BM筛查的NLP工具,该模型正在安大略省进行多中心验证。这种基于真实临床文本的自动化解决方案,有望显著提升BM的流行病学监测能力和早期诊断率。

这项研究标志着人工智能在神经肿瘤学应用的重要进展。通过将先进的NLP技术与临床工作流程无缝结合,不仅解决了BM病例捕获不足的难题,更开创了癌症监测的新范式。模型展现出的高灵敏度特别适合作为临床决策支持系统的第一道筛查关卡,而其在加拿大不同省份间的可移植性验证,则为全国性癌症登记系统的智能化升级奠定了基础。随着医疗AI技术的不断发展,这类基于真实世界数据的自动化解决方案,将在提高诊疗效率、优化资源配置方面发挥越来越重要的作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号