
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型的临床笔记摘要系统开发与评估:提升巴西医疗文档质量的新路径
【字体: 大 中 小 】 时间:2025年08月30日 来源:Communications Medicine 6.3
编辑推荐:
本研究针对巴西公立医疗系统中临床笔记冗长复杂、出院摘要质量参差不齐的问题,开发了结合命名实体识别(NER)和大语言模型(LLM)的智能摘要系统。通过128份患者调查和10位医生访谈验证,该系统生成的出院摘要质量61.54%获评"非常好",准确率接近人工水平,显著改善了医疗信息传递效率,为资源受限地区的医疗文档自动化提供了可行方案。
在巴西庞大的统一医疗系统(SUS)中,每天产生海量临床笔记,这些记录承载着患者住院期间的关键信息,却因篇幅冗长、结构混乱成为医生负担。调查显示,32.8%的患者从未收到出院摘要,而97.7%的患者渴望获得这份关乎后续治疗的重要文件。更棘手的是,62.2%依赖公立医疗的巴西民众常遭遇信息断层——初级保健医生抱怨缺失用药变更记录,患者苦恼于找不到检查结果,这种沟通鸿沟直接威胁着医疗安全。传统人工整理方式在超负荷工作的医生面前显得力不从心,这正是Juliana Damasio Oliveira团队在《Communications Medicine》发表研究的现实背景。
研究团队采用三步法突破困境:首先通过在线问卷(n=128)和医生访谈(n=10)锁定需求痛点;随后开发结合Flair命名实体识别(NER)和GPT-4大语言模型(LLM)的混合系统,其中LLM经葡萄牙语医疗文本微调;最后建立五级评分体系让医生实时评估摘要质量。系统创新性地采用"先提取后生成"策略——NER快速定位临床笔记中的关键实体(如过敏史、入院原因),LLM仅处理这些标记内容生成结构化摘要,既控制成本又解决长文本处理难题。所有数据来自巴西150家合作医院,严格遵循伦理审查(CAAE 75541023.5.0000.5336)。
【系统设计与用户反馈】

开发流程严格遵循图1所示的三阶段框架。医生们对图2所示的网络界面反响积极,该界面同步显示原始数据和AI生成的12个标准模块(包括"出院计划"、"影像检查"等),支持即时编辑。值得注意的是,73.44%患者和全部医生对AI辅助持开放态度,但10.9%患者要求过滤堕胎史等敏感信息,这促使团队采用数据最小化策略——仅向LLM传输必要医疗实体。
【模型性能评估】
与传统方法相比,混合系统展现出显著优势:NER处理长文本的成本仅为LLM的1/10,而GPT-4在诊断解释上的F1-Score接近人类水平。实际应用中,61.54%的AI摘要获评"非常好",仅5.13%被评为"一般"。但细项分析暴露改进空间——51.9%的医生认为部分内容不够详尽,特别是实验室结果呈现方式需要优化为对比表格形式。
【讨论与展望】
这项研究突破了LLM在葡萄牙语医疗场景的应用瓶颈,其创新性体现在三方面:一是针对巴西医疗场景定制开发,解决SUS系统特有的信息断层;二是采用"人类监督+AI生成"的协作模式,既保留医生决策权又提升效率;三是建立动态评估机制,通过医生评分持续优化模型。局限性在于当前样本量(n=28)较小,且缺乏盲法评估。未来需扩展至更多专科场景,并探索多模态数据整合,但团队已证实——在资源受限地区,经过严谨设计的AI工具能成为提升医疗质量的"均衡器"。正如一位受访医生所言:"当AI把零散的临床笔记变成条理清晰的出院摘要时,我们终于能专注于诊疗而非文书了。"
生物通微信公众号
知名企业招聘