在隐私限制条件下，使用本地部署的大型语言模型进行符合BI-RADS标准的结构化乳腺X线摄影报告生成

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《European Radiology》：BI-RADS-compliant structured mammography reporting using locally deployed large language models under privacy constraints

【字体：大中小】 时间：2025年11月20日 来源：European Radiology 4.7

编辑推荐：

　　隐私保护型乳腺X光报告结构化方法基于本地微调的开源大语言模型（LLM）开发，通过监督学习使用商业Qwen-Max模型的伪标签对Llama-3进行低秩适配优化。研究收集并分析7161份无结构化报告，构建符合BI-RADS规范的嵌套JSON输出格式，在23项特征上验证精度（F1=0.932），结构完整度达96.4%（JFA）和100%（FIA）。虽整体性能略低于Qwen-Max，但通过本地部署显著提升隐私保护，满足GDPR等法规要求，为医疗机构提供标准化、合规的数据处理方案。

摘要

目的

开发一种利用本地微调的开源大型语言模型（LLM）来结构化免费文本乳腺X光报告的隐私保护方法。

材料与方法

在这项多中心研究中，从三个机构收集了7161份非结构化的乳腺X光报告。开源的Llama-3模型通过使用商业Qwen-Max模型的伪标签进行监督学习进行了微调，并进行了低秩适配。所有标签均由商业Qwen-Max模型生成，而非人工注释。结构化输出遵循BI-RADS导向的嵌套JSON格式。性能通过精确度（Precision）、召回率（Recall）和F1分数（F1-score）在23个特征上进行评估。结构完整性通过JSON格式准确性（JFA）和字段完整性准确性（FIA）指标进行评估。统计比较使用配对Wilcoxon符号秩检验和Cohen’s d效应量进行。

结果

共从三个机构回顾性地获取并分析了7161份报告。微调模型在第10个训练周期取得了优异的性能（精确度0.942，召回率0.929，F1分数0.932），JFA和FIA分别达到了0.964和1.000，显示出相对于基础模型的显著提升（p < 0.05，Cohen’s d > 0.8）。虽然整体性能略低于Qwen-Max模型，但该模型在某些方面仍表现出中等但具有统计意义的差异（p < 0.05；0.5 < Cohen’s d < 0.8），尤其是在“特殊征象”类别中（F1 = 0.737 vs 0.947）。

结论

该方法利用本地微调的开源LLM有效地将乳腺X光报告转换为结构化数据。尽管存在一定的性能折中，但它提高了隐私保护水平，并且可以在本地部署。其准确性、临床相关性和合规性使其成为医疗机构的实用解决方案。

关键点

问题免费文本乳腺X光报告缺乏标准化，使得结构化提取变得困难，而现有的解决方案通常会牺牲隐私性、适应性或需要昂贵的商业工具。

发现我们微调的LLaMA-3模型在完全本地化的部署流程中实现了高提取准确性（F1分数：0.932）和完整的结构完整性（FIA：1.000）。

临床相关性 该方法实现了标准化和隐私保护的乳腺X光报告，不会干扰临床工作流程，支持更安全的人工智能集成，提高数据质量，并符合《通用数据保护条例》（GDPR）等法规要求。

图形摘要

热点排行

新闻专题

联系信箱：

粤ICP备09063491号