在隐私限制条件下,使用本地部署的大型语言模型进行符合BI-RADS标准的结构化乳腺X线摄影报告生成

《European Radiology》:BI-RADS-compliant structured mammography reporting using locally deployed large language models under privacy constraints

【字体: 时间:2025年11月20日 来源:European Radiology 4.7

编辑推荐:

  隐私保护型乳腺X光报告结构化方法基于本地微调的开源大语言模型(LLM)开发,通过监督学习使用商业Qwen-Max模型的伪标签对Llama-3进行低秩适配优化。研究收集并分析7161份无结构化报告,构建符合BI-RADS规范的嵌套JSON输出格式,在23项特征上验证精度(F1=0.932),结构完整度达96.4%(JFA)和100%(FIA)。虽整体性能略低于Qwen-Max,但通过本地部署显著提升隐私保护,满足GDPR等法规要求,为医疗机构提供标准化、合规的数据处理方案。

  

摘要

目的

开发一种利用本地微调的开源大型语言模型(LLM)来结构化免费文本乳腺X光报告的隐私保护方法。

材料与方法

在这项多中心研究中,从三个机构收集了7161份非结构化的乳腺X光报告。开源的Llama-3模型通过使用商业Qwen-Max模型的伪标签进行监督学习进行了微调,并进行了低秩适配。所有标签均由商业Qwen-Max模型生成,而非人工注释。结构化输出遵循BI-RADS导向的嵌套JSON格式。性能通过精确度(Precision)、召回率(Recall)和F1分数(F1-score)在23个特征上进行评估。结构完整性通过JSON格式准确性(JFA)和字段完整性准确性(FIA)指标进行评估。统计比较使用配对Wilcoxon符号秩检验和Cohen’s d效应量进行。

结果

共从三个机构回顾性地获取并分析了7161份报告。微调模型在第10个训练周期取得了优异的性能(精确度0.942,召回率0.929,F1分数0.932),JFA和FIA分别达到了0.964和1.000,显示出相对于基础模型的显著提升(p < 0.05,Cohen’s d > 0.8)。虽然整体性能略低于Qwen-Max模型,但该模型在某些方面仍表现出中等但具有统计意义的差异(p < 0.05;0.5 < Cohen’s d < 0.8),尤其是在“特殊征象”类别中(F1 = 0.737 vs 0.947)。

结论

该方法利用本地微调的开源LLM有效地将乳腺X光报告转换为结构化数据。尽管存在一定的性能折中,但它提高了隐私保护水平,并且可以在本地部署。其准确性、临床相关性和合规性使其成为医疗机构的实用解决方案。

关键点

问题 免费文本乳腺X光报告缺乏标准化,使得结构化提取变得困难,而现有的解决方案通常会牺牲隐私性、适应性或需要昂贵的商业工具。

发现 我们微调的LLaMA-3模型在完全本地化的部署流程中实现了高提取准确性(F1分数:0.932)和完整的结构完整性(FIA:1.000)。

临床相关性 该方法实现了标准化和隐私保护的乳腺X光报告,不会干扰临床工作流程,支持更安全的人工智能集成,提高数据质量,并符合《通用数据保护条例》(GDPR)等法规要求。

图形摘要

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号