
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在隐私限制条件下,使用本地部署的大型语言模型进行符合BI-RADS标准的结构化乳腺X线摄影报告生成
《European Radiology》:BI-RADS-compliant structured mammography reporting using locally deployed large language models under privacy constraints
【字体: 大 中 小 】 时间:2025年11月20日 来源:European Radiology 4.7
编辑推荐:
隐私保护型乳腺X光报告结构化方法基于本地微调的开源大语言模型(LLM)开发,通过监督学习使用商业Qwen-Max模型的伪标签对Llama-3进行低秩适配优化。研究收集并分析7161份无结构化报告,构建符合BI-RADS规范的嵌套JSON输出格式,在23项特征上验证精度(F1=0.932),结构完整度达96.4%(JFA)和100%(FIA)。虽整体性能略低于Qwen-Max,但通过本地部署显著提升隐私保护,满足GDPR等法规要求,为医疗机构提供标准化、合规的数据处理方案。
开发一种利用本地微调的开源大型语言模型(LLM)来结构化免费文本乳腺X光报告的隐私保护方法。
在这项多中心研究中,从三个机构收集了7161份非结构化的乳腺X光报告。开源的Llama-3模型通过使用商业Qwen-Max模型的伪标签进行监督学习进行了微调,并进行了低秩适配。所有标签均由商业Qwen-Max模型生成,而非人工注释。结构化输出遵循BI-RADS导向的嵌套JSON格式。性能通过精确度(Precision)、召回率(Recall)和F1分数(F1-score)在23个特征上进行评估。结构完整性通过JSON格式准确性(JFA)和字段完整性准确性(FIA)指标进行评估。统计比较使用配对Wilcoxon符号秩检验和Cohen’s d效应量进行。
共从三个机构回顾性地获取并分析了7161份报告。微调模型在第10个训练周期取得了优异的性能(精确度0.942,召回率0.929,F1分数0.932),JFA和FIA分别达到了0.964和1.000,显示出相对于基础模型的显著提升(p < 0.05,Cohen’s d > 0.8)。虽然整体性能略低于Qwen-Max模型,但该模型在某些方面仍表现出中等但具有统计意义的差异(p < 0.05;0.5 < Cohen’s d < 0.8),尤其是在“特殊征象”类别中(F1 = 0.737 vs 0.947)。
该方法利用本地微调的开源LLM有效地将乳腺X光报告转换为结构化数据。尽管存在一定的性能折中,但它提高了隐私保护水平,并且可以在本地部署。其准确性、临床相关性和合规性使其成为医疗机构的实用解决方案。
问题 免费文本乳腺X光报告缺乏标准化,使得结构化提取变得困难,而现有的解决方案通常会牺牲隐私性、适应性或需要昂贵的商业工具。
发现 我们微调的LLaMA-3模型在完全本地化的部署流程中实现了高提取准确性(F1分数:0.932)和完整的结构完整性(FIA:1.000)。
临床相关性 该方法实现了标准化和隐私保护的乳腺X光报告,不会干扰临床工作流程,支持更安全的人工智能集成,提高数据质量,并符合《通用数据保护条例》(GDPR)等法规要求。
生物通微信公众号
知名企业招聘