
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型的零样本与少样本药物处方命名实体识别与文本扩展研究
【字体: 大 中 小 】 时间:2025年06月21日 来源:Artificial Intelligence in Medicine 6.1
编辑推荐:
本研究针对电子健康记录(EHR)中自由文本药物处方存在格式混乱、缩写多样等问题,利用ChatGPT3.5开展命名实体识别(NER)和文本扩展(EX)研究。通过零样本和少样本提示策略,在100条人工标注数据上实现NER平均F1值0.94,EX平均F1值0.87,显著提升处方可读性与机器可处理性,为临床用药安全提供新范式。
在医疗信息化快速发展的今天,电子健康记录(EHR)中药物处方的自由文本格式却成为阻碍信息标准化处理的"最后一公里"。医生们习惯使用"ASA 100 qPM"这类包含拉丁缩写("qPM"表示每日傍晚一次)、混合语言(如泰语字符"
来自奥地利格拉茨医科大学与泰国清迈大学的研究团队在《Artificial Intelligence in Medicine》发表的研究,创新性地将大语言模型(LLM)应用于药物处方结构化处理。研究通过优化ChatGPT3.5的提示策略,在零样本(不提供示例)和少样本(提供5-10个示例)两种模式下,系统评估了命名实体识别(NER)和文本扩展(EX)性能。实验使用100条经专家标注的泰国处方数据,包含药物名称(Medication)、剂量(Strength)、单位(Unit)、给药方式(Mode)和用药指导(Instructions)五类实体。结果显示,少样本提示能有效抑制模型幻觉(hallucination),最佳NER提示在测试集达到0.94的F1值,EX任务中少样本提示也以0.87的F1值优于零样本基线。研究还发现,ChatGPT4o、Gemini 2.0 Flash等新模型性能普遍超越ChatGPT3.5。
关键技术包括:1) 构建包含混合语言(泰英)和特殊符号的处方标注语料;2) 设计分层提示策略(如NER-Per-Temp-5表示含5个示例的逐实体模板);3) 采用严格匹配(要求边界完全一致)和部分匹配(允许边界重叠)双指标评估;4) 通过专家评议验证EX结果的语义等价性。
【零样本和少样本命名实体识别(NER)】
比较六种提示策略发现,包含实体类型解释的"NER-Per-Temp"系列优于简单模板。少样本提示显著提升小实体(如Unit)识别,其中"NER-Per-Temp-10"(10个示例)对Unit的召回率达0.91,但"NER-Temp-5"在该项表现最差(F1=0.68),显示示例数量与质量共同影响性能。
【文本扩展(EX)】
专家评估显示,少样本提示能将"ASA 100"准确扩展为"乙酰水杨酸100毫克口服片剂",而零样本易产生"100毫升注射液"等错误。模型对拉丁缩写转换最佳(F1=0.93),但对泰语符号处理仍需改进(F1=0.79)。
【对比既往研究】
相较传统规则系统(如MetaMap)和深度学习模型(MT-NER-PMB),LLM在非标准括号用法(如"ASA(500)")和混合语言场景下表现更优。但与专用医疗模型(如MedLM-1.5-Large)相比,通用LLM在专业术语一致性上仍有差距。
该研究证实LLM能有效解决非标准化处方的机器解读难题,其价值体现在三方面:首先,少样本学习大幅降低幻觉风险,这对用药安全至关重要;其次,模型展现出色的跨语言适应能力,为多语言医疗环境提供通用解决方案;最后,提示工程优化经验可直接迁移至更新模型(如GPT-4o)。未来可通过融入专业术语库(如SNOMED CT)进一步提升准确性,推动CPOE(计算机化医嘱录入)系统在资源有限地区的普及。
生物通微信公众号
知名企业招聘