TriMedPrompt:基于三元提示的临床病程记录生成框架——实现真实性与结构化统一的创新方法
《Journal of Biomedical Informatics》:TriMedPrompt: A unified prompting framework for realistic and layout-conformant clinical progress note synthesis
【字体:
大
中
小
】
时间:2025年10月19日
来源:Journal of Biomedical Informatics 4.5
编辑推荐:
本文提出TriMedPrompt混合提示框架,通过整合真实临床笔记(MIMIC-III)、病例报告(PMC-Patients)和知识图谱(PrimeKG)三元信号,利用大语言模型(LLM)生成结构合规(SOAP/BIRP/PIE/DAP等格式)、语义连贯的合成病程记录。该研究在临床自然语言处理(NLP)领域开创了隐私保护的合成数据生成范式,为患者建模与临床决策支持系统提供新方案。
我们的研究揭示了利用结构化和非结构化生物医学资源生成合成临床记录的几个关键发现。
首先,通过PrimeKG引入结构化领域知识可增强事实准确性,将生成过程锚定于有效的医学关系(如药物-疾病、症状-诊断)。然而,仅使用知识图谱(KG)的生成结果在句法上过于简单、语义稀疏,语言常类似项目符号列表或碎片化内容,限制了临床实用性。
将病例报告(通过FAISS检索)与知识图谱结合,显著改善了叙事流畅性和临床连贯性。病例报告提供了完整的临床叙事模板,而知识图谱则注入特定医学事实,产生既信息丰富又易于阅读的文本。这种协同作用凸显了叙事语境在将结构化知识转化为临床可读文本中的价值。
我们的研究强调了利用结构化和非结构化生物医学资源进行合成临床记录生成的关键见解。
最重要的发现是混合方法的价值——没有单一模态足以生成既真实又符合布局要求的笔记。知识图谱确保事实准确性,病例报告提供语言模型,真实电子健康记录(EHR)笔记注入领域特定的风格变化。这种多模态 grounding 使大型语言模型(LLM)能够适应不同的临床场景和专业需求。
此外,布局一致性(例如SOAP1、BIRP、PIE、DAP)严格依赖于在提示中明确加入格式特定的指令。当提供清晰的节标题和内容指南时,LLM能可靠地生成符合文档标准的笔记。消融实验证实,省略布局指令会导致结构不一致,即使语义内容准确。
我们提出了一种集成时序对齐的病程记录、生物医学病例报告和结构化知识图谱事实的混合流水线,用于生成合成临床记录。消融研究表明每种模态都具有互补优势——PrimeKG提供事实准确性,病例报告提供语言结构,真实记录提供语境基础——从而产生临床精准、叙事连贯的输出,紧密反映真实文档。
除了内在评估,下游实验证明了合成笔记在隐私保护临床自然语言处理(NLP)中的实用性。在MIMIC-III的受限设置中,使用合成数据训练的命名实体识别(NER)和文本分类模型达到了与使用真实笔记训练的模型相近的性能(F1分数差异<2%)。这为在敏感医疗环境中进行模型开发和基准测试提供了安全途径。
未来工作将探索动态提示调整、多模态集成(如临床表格数据),以及跨不同医疗系统和专业的领域适应。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号