
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于生成预训练Transformer的文本和图像头影测量提示的比较分析:采用一种新型的人工智能辅助诊断与治疗计划指数(AIDTI)
《BMC Medical Informatics and Decision Making》:Comparative analysis of generative pre-trained transformers for text- and image-based cephalometric prompts using a novel Artificial Intelligence Based Diagnosis and Treatment Planning Index (AIDTI)
【字体: 大 中 小 】 时间:2026年06月03日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
摘要引言本研究的目的是比较基于文本和图像提示的生成式预训练Transformer(GPT)对相同侧位头影片(LCs)的响应能力,使用新开发的人工智能辅助诊断和治疗计划指数(AIDTI)进行评估。方法研究共纳入了90张侧位头影片,这些头影片来自30个病例,分别具有I类、II类和II
本研究的目的是比较基于文本和图像提示的生成式预训练Transformer(GPT)对相同侧位头影片(LCs)的响应能力,使用新开发的人工智能辅助诊断和治疗计划指数(AIDTI)进行评估。
研究共纳入了90张侧位头影片,这些头影片来自30个病例,分别具有I类、II类和III类骨骼错颌。这些头影片以两种不同的格式呈现给GPT-4o、GPT-o3 pro、GPT-5和GPT-5 pro:基于文本的格式(包含头影测量数据的数值数据)和基于图像的格式(直接上传图像)。GPT的响应通过新开发的AIDTI进行评估,评分范围为0-10分,评估标准包括五个方面:诊断准确性、鉴别诊断能力、提出的治疗计划的临床适用性、治疗计划相关风险和并发症的披露情况以及提供替代治疗选项的能力。
在基于文本的提示下,GPT的表现更为出色,其中GPT-5 pro获得了最高分(9.62±1.13)。相比之下,所有GPT在基于图像的提示下的表现明显较低,GPT-o3 pro的最高分为4.16±4.12。此外,所有模型都表现出将错颌随机分类为II类的倾向,表明其预测存在系统性偏差。
AIDTI为GPT性能的简洁、平衡和临床意义的解释提供了一个结构化且多维度的框架。由于GPT无法直接分析侧位头影片,因此现阶段它们作为独立的或可靠的支持工具在正畸学中的应用仍然有限。只有当正畸医生使用基于文本的头影测量数据来提示模型时,GPT才能更可靠地为正畸实践做出贡献。
不适用。
本研究的目的是比较基于文本和图像提示的生成式预训练Transformer(GPT)对相同侧位头影片(LCs)的响应能力,使用新开发的人工智能辅助诊断和治疗计划指数(AIDTI)进行评估。
研究共纳入了90张侧位头影片,这些头影片来自30个病例,分别具有I类、II类和III类骨骼错颌。这些头影片以两种不同的格式呈现给GPT-4o、GPT-o3 pro、GPT-5和GPT-5 pro:基于文本的格式(包含头影测量数据的数值数据)和基于图像的格式(直接上传图像)。GPT的响应通过新开发的AIDTI进行评估,评分范围为0-10分,评估标准包括五个方面:诊断准确性、鉴别诊断能力、提出的治疗计划的临床适用性、治疗计划相关风险和并发症的披露情况以及提供替代治疗选项的能力。
在基于文本的提示下,GPT的表现更为出色,其中GPT-5 pro获得了最高分(9.62±1.13)。相比之下,所有GPT在基于图像的提示下的表现明显较低,GPT-o3 pro的最高分为4.16±4.12。此外,所有模型都表现出将错颌随机分类为II类的倾向,表明其预测存在系统性偏差。
AIDTI为GPT性能的简洁、平衡和临床意义的解释提供了一个结构化且多维度的框架。由于GPT无法直接分析侧位头影片,因此现阶段它们作为独立的或可靠的支持工具在正畸学中的应用仍然有限。只有当正畸医生使用基于文本的头影测量数据来提示模型时,GPT才能更可靠地为正畸实践做出贡献。
不适用。