ChatGPT-3.5与ChatGPT-4在阻塞性睡眠呼吸暂停患者教育中的准确性及可读性对比研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月11日 来源：SN Comprehensive Clinical Medicine

编辑推荐：

　　为解决人工智能辅助患者教育的可靠性问题，研究人员针对阻塞性睡眠呼吸暂停综合征(OSAS)，对比评估ChatGPT-3.5与ChatGPT-4生成的50个临床问题的回答质量。结果显示：ChatGPT-4准确率达88%（vs 3.5的79%），但两者文本均需大学阅读水平。该研究为AI医疗咨询工具优化提供重要依据。

这项开创性研究对两大AI模型在阻塞性睡眠呼吸暂停综合征(Obstructive Sleep Apnea Syndrome, OSAS)患者教育场景的表现进行了系统评估。研究团队严格遵循美国睡眠医学会(American Academy of Sleep Medicine)和美国胸科学会(American Thoracic Society)指南，精心设计50个典型患者咨询问题。

通过双盲实验设计，让5位耳鼻咽喉科(ENT)专家和3位住院医师对ChatGPT-3.5和ChatGPT-4相隔45天的两次回答进行盲评。采用4级准确性量表（1分=全面正确，4分=完全错误）和专业可读性指标——Flesch-Kincaid年级水平(Flesch-Kincaid Grade Level)与Flesch易读性评分(Flesch Reading Ease)进行量化分析。

数据表明，升级版ChatGPT-4展现出显著优势：88%的回答被评为"全面准确"，较3.5版的79%提升明显。但有趣的是，两个版本生成的科普内容都相当于大学阅读水平（Flesch-Kincaid评分>12），对普通患者仍存在理解门槛。这项研究不仅验证了GPT-4在医疗咨询领域的进步，更揭示了AI健康科普面临的"专业性与普适性"平衡难题。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号