ChatGPT 与 NASS 临床指南在退行性腰椎滑脱中的对比分析:一项针对 AI 在脊柱疾病诊疗中应用潜力的研究

【字体: 时间:2025年05月18日 来源:European Spine Journal 2.6

编辑推荐:

  本推荐聚焦 ChatGPT 与 NASS(北美脊柱外科学会)临床指南在退行性腰椎滑脱(degenerative spondylolisthesis)诊疗中的对比研究。研究评估 ChatGPT 在模拟临床场景下的表现,探讨提示工程、模型微调及开源 LLM(如 LLaMA、DeepSeek)潜力,为 AI 在脊柱外科的临床应用提供参考。

  
在医疗人工智能(AI)蓬勃发展的当下,脊柱疾病的精准诊疗仍面临诸多挑战。传统临床指南虽为诊疗提供了标准化框架,但如何高效整合海量医学数据、提升决策效率成为亟待解决的问题。近年来,大型语言模型(LLM)如 ChatGPT 展现出强大的信息处理能力,但其在医学领域的可靠性与临床适用性仍存争议。退行性腰椎滑脱作为脊柱外科常见疾病,其诊疗需综合影像学、病史及指南推荐,AI 能否在此过程中辅助临床决策成为重要研究方向。基于此,美国西奈山伊坎医学院(Icahn School of Medicine at Mount Sinai)的研究人员开展了 “ChatGPT 与 NASS 临床指南在退行性腰椎滑脱中的对比分析” 研究,相关成果发表于《European Spine Journal》,旨在评估 ChatGPT 在模拟临床场景中的表现,探索 AI 在脊柱疾病诊疗中的应用潜力与局限。

研究主要采用对比分析方法,将 ChatGPT 的诊疗建议与北美脊柱外科学会(NASS)发布的退行性腰椎滑脱临床指南进行系统性比对。研究未使用高度结构化提示或专业提示工程训练,以模拟临床医生常规使用场景。同时,研究探讨了模型微调(如基于脊柱外科和骨科数据集优化 LLM)及开源 LLM(如 LLaMA、DeepSeek)在提升 AI 准确性与透明度中的潜在价值。

研究结果


1. ChatGPT 的临床表现与提示工程的影响


研究发现,ChatGPT 在退行性腰椎滑脱的诊疗建议中与 NASS 指南存在一定一致性,但在细节准确性与指南 adherence(依从性)方面仍有不足。常规使用场景下的非结构化提示虽贴近临床实际,但可能限制模型性能。研究指出,精细化提示策略或可提升准确性,但需平衡临床实用性,因真实诊疗中时间限制常阻碍复杂提示的应用。

2. 领域特异性模型微调的必要性


由于通用 LLM(如 ChatGPT-3.5、ChatGPT-4.0)未优先纳入医学训练数据,基于脊柱外科数据集的模型微调被证实可增强与指南的一致性,并降低 “幻觉引用”(hallucinated references)风险。然而,该过程需解决数据可及性、代表性、伦理筛选及动态更新等挑战。

3. 开源 LLM 的优势与局限


开源模型(如 LLaMA、DeepSeek)因其可定制性,为研究人员提供了比专有模型更灵活的微调空间,有助于提升算法透明度与协作性。但专有模型凭借强大计算资源,在大规模数据处理能力上仍具显著优势,开源模型短期内难以企及。

4. 多维度优化 AI 临床应用的必要性


研究强调,提升 LLM 在医学中的可靠性需跨学科协作,涵盖提示工程优化、领域数据整合、模型微调及开源技术发展等多方面。单一技术路径难以全面解决临床适用性问题,需构建系统性优化框架。

研究结论与意义


本研究首次系统对比了 ChatGPT 与 NASS 临床指南在退行性腰椎滑脱中的诊疗建议,揭示了 AI 在脊柱外科应用的潜力与关键瓶颈。结果表明,通用 LLM 在缺乏医学领域优化时存在准确性局限,但通过提示工程改进、领域数据微调及开源模型创新,AI 有望成为临床决策的高效辅助工具。研究同时提出,需建立跨学科协作机制,解决数据伦理、模型更新及临床验证等问题,为推动 AI 在循证医学中的规范化应用奠定了基础。该成果不仅为脊柱外科的 AI 辅助诊疗提供了实证依据,也为其他医学领域的 LLM 研究提供了方法论参考,标志着 AI 在精准医疗领域迈出重要一步。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号