肩关节脱位的APX光片诊断:骨科医生、急诊医生与ChatGPT模型诊断性能的比较分析

《Injury》:Diagnosis of shoulder dislocation on AP radiographs: a comparative analysis of diagnostic performance between orthopedic surgeons, emergency physicians, and ChatGPT models

【字体: 时间:2025年12月14日 来源:Injury 2.2

编辑推荐:

  本研究评估ChatGPT在急性肩关节脱位诊断中的准确性,并与骨科专家、住院医师比较。结果显示专家准确率最高(95.0%),AI模型(4o/5.1)表现较低(72.4%-78.0%),尤其在脱位类型分类中差距更大(68.0%-69.6%)。研究指出单张AP片不足,需结合其他影像,AI可作为初步筛查工具但暂不适用临床独立诊断。

  
阿尔珀·基里尔马兹(Alper Kirilmaz)| 图尔古特·E·埃尔德姆(Turgut E. Erdem)| 哈卢克·亚卡(Haluk Yaka)| 艾哈迈德·伊尔迪里姆(Ahmet Yildirim)| 穆斯塔法·奥泽尔(Mustafa Ozer)
土耳其科尼亚市医院骨科与创伤学系

摘要

目的

本研究旨在评估ChatGPT在识别急性肩关节脱位方面的诊断性能,并将其准确性与骨科专家和急诊医学住院医师的诊断准确性进行比较。

方法

研究共纳入了250张肩关节前后位(AP)X光片。所有图像均由四组人员进行评估:骨科专家(n=10)、急诊医学住院医师(n=10)以及ChatGPT。通过标准化的单张图像加文本提示方式,使用OpenAI的ChatGPT-4o(2024年5月版本)和ChatGPT-5.1(2025年7月版本)进行评估。这些模型之前未接受过放射图像的训练。诊断性能通过敏感性、特异性、阳性预测值、阴性预测值、总准确率、ROC曲线下面积(AUC)、F1分数以及Cohen’s kappa系数(用于评估评估者间的一致性)来衡量。

结果

在识别肩关节脱位(存在/不存在)方面,骨科专家的准确率最高(95.0%),而ChatGPT-4o的准确率最低(72.4%)。急诊医学住院医师的准确率为90.1%,ChatGPT-5.1的准确率为78.0%。当考虑脱位类型(前脱位、后脱位、下脱位)时,骨科专家的表现依旧最好(89.7%),ChatGPT-4o的准确率最低(68.0%)。急诊医学住院医师的准确率(84.7%)高于ChatGPT-5.1(69.6%)。未发生脱位的肩关节内部旋转前后位X光片经常被误判为后脱位。

结论

研究表明,急性肩关节脱位的诊断准确性因临床医生的经验水平而异。仅依靠一张前后位肩关节X光片不足以诊断肩关节脱位。临床医生最常将内部旋转的前后位X光片误判为后脱位。ChatGPT模型的表现尚可,但目前尚不适合作为独立的临床决策工具。然而,随着基于人工智能系统的进一步发展,这些模型可能在紧急情况下作为快速初步筛查工具使用。

部分内容摘录

引言

肩关节脱位是指由于创伤性或非创伤性原因导致盂肱关节面分离的情况,是骨科急诊中最常见的重大关节脱位类型。肩关节脱位约占所有大关节脱位的50%[1]。由于其广泛的运动范围,肩关节极易受到损伤;当这种极端的活动性与静态和动态稳定结构的损伤结合时,脱位的风险会增加。

研究设计与参与者

本研究为单中心、回顾性、比较性诊断准确性研究,使用的是2020年3月至2025年3月期间从医院PACS(图像存档与通信系统)中获取的放射学数据。
研究共纳入了122张因肩部创伤就诊于急诊科且通过计算机断层扫描(CT)确诊为肩关节脱位的患者的肩关节前后位X光片(其中76名为男性)。

结果

所有性能分析均基于每位评估者对250张图像的独立评分进行计算,团队得分基于平均值得出。由于ChatGPT模型仅使用了一组评估数据,因此未进行方差分析。
研究共纳入122名肩关节脱位患者(76名男性,46名女性,右侧85例,左侧37例)以及128名未发生脱位的患者(81名男性,47名女性,右侧82例,左侧46例)。

讨论

本研究最重要的发现是:在评估前后位(AP)肩关节X光片方面,骨科专家的诊断准确性最高,其次是急诊医学住院医师,而ChatGPT-4o的准确率最低。尽管ChatGPT-5.1模型的表现优于前一版本,但并未显示出统计学上的显著提升。

结论

研究表明,临床医生在诊断急性肩关节脱位方面的准确性因经验水平而异。仅依靠前后位X光片作为初始诊断工具是不够的,特别是对于排除后脱位或非典型脱位情况,需要额外的影像学检查。ChatGPT模型在诊断肩关节脱位方面的表现尚可,但尚未达到独立使用的水平。

伦理批准

本研究已获得Necmettin Erbakan大学伦理委员会的批准(批准编号:2025/5965)。

资金支持

利益冲突

作者贡献声明

阿尔珀·基里尔马兹(Alper Kirilmaz):资源提供、项目管理、概念设计。图尔古特·E·埃尔德姆(Turgut E. Erdem):数据分析、数据整理。哈卢克·亚卡(Haluk Yaka):方法学设计、数据整理。艾哈迈德·伊尔迪里姆(Ahmet Yildirim):写作、审稿与编辑。穆斯塔法·奥泽尔(Mustafa Ozer):初稿撰写。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号