
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一个专为实验室检测参考范围及解读问题解答而策划的数据集
《Scientific Data》:A Curated Dataset for Question Answering on Laboratory Test Reference Ranges and Interpretation
【字体: 大 中 小 】 时间:2026年06月11日 来源:Scientific Data 6.9
编辑推荐:
摘要 实验室检测对于诊断和管理健康状况至关重要,它们为结果解读提供了必要的参考范围。实验室检测种类繁多,这些检测结果会受到样本类型(如血液、尿液)、性别、年龄以及妊娠等其他因素的影响,因此自动化解读存在挑战。试图自动解读这些检测结果的临床决策支持系统必须考虑到
实验室检测对于诊断和管理健康状况至关重要,它们为结果解读提供了必要的参考范围。实验室检测种类繁多,这些检测结果会受到样本类型(如血液、尿液)、性别、年龄以及妊娠等其他因素的影响,因此自动化解读存在挑战。试图自动解读这些检测结果的临床决策支持系统必须考虑到这些细微差别,以避免误诊或错误的临床决策。在这方面,我们介绍了LabQAR(一种基于参考范围的实验室问题解答系统)。该数据集由人工整理而成,包含了来自权威医学来源的550项实验室检测的参考范围,涵盖了363种不同的检测项目,并附有关于参考范围、样本类型以及其他影响解读因素的注释。我们还评估了几种大型语言模型(LLMs)在预测参考范围以及将检测结果分类为正常、偏低或偏高的能力,这些模型包括LLaMA 3.1、GatorTronGPT、GPT-3.5 turbo、GPT-4 turbo和GPT-4o。研究结果表明,GPT-4o的表现优于其他模型,这展示了大型语言模型在临床决策支持方面的潜力。