ChatGPT-3.5与ChatGPT-4在阻塞性睡眠呼吸暂停患者教育中的准确性及可读性对比研究

【字体: 时间:2025年06月11日 来源:SN Comprehensive Clinical Medicine

编辑推荐:

  为解决人工智能辅助患者教育的可靠性问题,研究人员针对阻塞性睡眠呼吸暂停综合征(OSAS),对比评估ChatGPT-3.5与ChatGPT-4生成的50个临床问题的回答质量。结果显示:ChatGPT-4准确率达88%(vs 3.5的79%),但两者文本均需大学阅读水平。该研究为AI医疗咨询工具优化提供重要依据。

  

这项开创性研究对两大AI模型在阻塞性睡眠呼吸暂停综合征(Obstructive Sleep Apnea Syndrome, OSAS)患者教育场景的表现进行了系统评估。研究团队严格遵循美国睡眠医学会(American Academy of Sleep Medicine)和美国胸科学会(American Thoracic Society)指南,精心设计50个典型患者咨询问题。

通过双盲实验设计,让5位耳鼻咽喉科(ENT)专家和3位住院医师对ChatGPT-3.5和ChatGPT-4相隔45天的两次回答进行盲评。采用4级准确性量表(1分=全面正确,4分=完全错误)和专业可读性指标——Flesch-Kincaid年级水平(Flesch-Kincaid Grade Level)与Flesch易读性评分(Flesch Reading Ease)进行量化分析。

数据表明,升级版ChatGPT-4展现出显著优势:88%的回答被评为"全面准确",较3.5版的79%提升明显。但有趣的是,两个版本生成的科普内容都相当于大学阅读水平(Flesch-Kincaid评分>12),对普通患者仍存在理解门槛。这项研究不仅验证了GPT-4在医疗咨询领域的进步,更揭示了AI健康科普面临的"专业性与普适性"平衡难题。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号