
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ChatGPT-3.5与ChatGPT-4在阻塞性睡眠呼吸暂停患者教育中的准确性及可读性对比研究
【字体: 大 中 小 】 时间:2025年06月11日 来源:SN Comprehensive Clinical Medicine
编辑推荐:
为解决人工智能辅助患者教育的可靠性问题,研究人员针对阻塞性睡眠呼吸暂停综合征(OSAS),对比评估ChatGPT-3.5与ChatGPT-4生成的50个临床问题的回答质量。结果显示:ChatGPT-4准确率达88%(vs 3.5的79%),但两者文本均需大学阅读水平。该研究为AI医疗咨询工具优化提供重要依据。
这项开创性研究对两大AI模型在阻塞性睡眠呼吸暂停综合征(Obstructive Sleep Apnea Syndrome, OSAS)患者教育场景的表现进行了系统评估。研究团队严格遵循美国睡眠医学会(American Academy of Sleep Medicine)和美国胸科学会(American Thoracic Society)指南,精心设计50个典型患者咨询问题。
通过双盲实验设计,让5位耳鼻咽喉科(ENT)专家和3位住院医师对ChatGPT-3.5和ChatGPT-4相隔45天的两次回答进行盲评。采用4级准确性量表(1分=全面正确,4分=完全错误)和专业可读性指标——Flesch-Kincaid年级水平(Flesch-Kincaid Grade Level)与Flesch易读性评分(Flesch Reading Ease)进行量化分析。
数据表明,升级版ChatGPT-4展现出显著优势:88%的回答被评为"全面准确",较3.5版的79%提升明显。但有趣的是,两个版本生成的科普内容都相当于大学阅读水平(Flesch-Kincaid评分>12),对普通患者仍存在理解门槛。这项研究不仅验证了GPT-4在医疗咨询领域的进步,更揭示了AI健康科普面临的"专业性与普适性"平衡难题。
生物通微信公众号
知名企业招聘