OpenAI o1-preview在牙科诊断中的突破性进展：基于ChatGPT性能的追踪评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月16日 来源：The Journal of the American Dental Association 3.1

编辑推荐：

　　本研究针对AI在复杂牙科病例诊断中的准确性难题，研究人员通过对比o1-preview与ChatGPT-3.5/4(legacy)在独立诊断（94% plausible DD/80% FD）和文献辅助诊断（86%准确率）的表现，证实新一代模型显著提升诊断效能（P<.05），为AI辅助牙科决策提供实证依据。

在牙科诊疗的复杂迷宫中，医生们常常需要像侦探一样拼凑患者的口腔症状、影像学表现和病史线索。然而，人类认知的局限性使得某些罕见病例的诊断成为耗时费力的挑战。近年来，以ChatGPT为代表的人工智能技术虽展现出辅助诊断潜力，但其在专业牙科领域的准确性和可靠性始终存在争议。尤其当面对发育异常、感染性疾病和肿瘤性病变等复杂病例时，AI模型的诊断能力究竟能达到什么水平？这个问题直接关系到这项技术能否真正进入临床实践。

McGill University（麦吉尔大学）Faculty of Dental Medicine and Oral Health Sciences的研究团队对此展开了系统性研究。他们采用创新的双路径评估框架，首次对OpenAI最新发布的o1-preview模型进行严格测试，并与前代产品ChatGPT-3.5和ChatGPT-4(legacy)进行横向比较。这项发表在《The Journal of the American Dental Association》的研究，为理解AI在牙科诊断中的演进提供了关键数据。

研究人员采用两种核心技术方法：一是让AI独立构建鉴别诊断(DD)并选择最终诊断(FD)，二是基于文献提供的DD进行诊断优化。研究纳入50例涵盖发育障碍、感染性疾病和肿瘤等多元化的诊断挑战病例，通过t检验和χ²检验进行统计学分析。

在"Results"部分，数据显示o1-preview独立诊断时产生合理DD的比例高达94%，较ChatGPT-3.5提升32%(P=.001)，较ChatGPT-4(legacy)提升18%(P=.012)；最终诊断准确率达80%，分别有40%和18%的显著提升。文献辅助模式下，诊断准确率进一步提升至86%，虽未达统计学显著，但展现出临床实用价值。

"Discussion"部分指出，o1-preview平均21.52秒的独立诊断耗时和15.04秒的文献辅助诊断速度，表明其具备临床实时应用的潜力。特别是在处理如釉质发育不全等需要多维度分析的病例时，AI展现出的系统性思维令人惊喜。

研究结论强调，虽然o1-preview尚未达到专家级诊断水平，但其在生成复杂病例DD方面的优异表现，已经使"AI是否应该用于牙科诊断"的讨论转变为"何时如何整合"的实践探讨。这项研究为AI辅助诊断系统的迭代发展设立了新基准，也为临床医生合理利用这类工具提供了重要参考。随着模型持续优化，未来可能出现人机协同诊断的新范式，最终实现更精准、更高效的牙科诊疗服务。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号