
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ChatGPT-4o与家庭医生在初级诊疗中的表现对比:一项关于患者常见问题的应答质量研究
【字体: 大 中 小 】 时间:2025年07月14日 来源:International Journal of Medical Informatics 3.7
编辑推荐:
本研究针对AI在初级医疗中的应用难题,通过比较ChatGPT-4o与家庭医生对200例常见临床问题的应答质量,发现AI在适当性(5.8±0.5)、准确性(5.8±0.5)、全面性(2.4±0.6)及共情力(4.8±0.4)上均显著优于医生(p<0.01),为AI辅助医疗决策提供了实证依据。
在医疗资源紧张的时代,患者常常面临候诊时间长、医生沟通时间有限等问题。与此同时,以ChatGPT为代表的人工智能(AI)技术正迅速渗透到医疗领域,但其在初级诊疗中的实际应用效果尚缺乏系统评估。尤其值得注意的是,家庭医生需要同时具备专业医学知识和良好的沟通能力,这对AI系统提出了更高要求。
为解答这一问题,研究人员开展了一项开创性研究,比较ChatGPT-4o与家庭医生在回答200个常见临床问题时的表现差异。这项发表在《International Journal of Medical Informatics》的研究采用了严谨的实验设计:通过文献回顾和专家验证建立问题库,由三位经验丰富的家庭医生和ChatGPT-4o分别作答,再由三位独立专家对回答进行盲法评估。评估指标包括适当性(1-6分)、准确性(1-6分)、全面性(1-3分)和共情力(1-5分),同时记录回答字数。
研究结果显示,ChatGPT-4o在所有评估维度上均显著优于人类医生。在适当性方面,AI得分为5.8±0.5,明显高于医生的4.3±1.0;准确性评分同样呈现优势(5.8±0.5 vs 4.5±1.1)。特别值得注意的是,在通常被认为需要"人性化"的共情力维度,ChatGPT-4o仍以4.8±0.4的得分领先于医生的4.0±0.8。唯一例外是在"常规咨询"和"儿童感染"两个主题上,AI的优势未达统计学显著性(p=0.07,0.08)。
在讨论部分,研究者指出这些发现具有多重意义:首先,证实了AI在提供标准化医疗信息方面的优势;其次,AI的长篇幅回答(平均298.8±82.3字)可能更有利于患者教育;最后,在保持共情力方面的表现打破了"AI缺乏人文关怀"的刻板印象。不过,研究者也强调需要进一步优化AI回答的简洁性和文化适应性。
这项研究为AI在初级医疗中的应用提供了重要参考,提示ChatGPT-4o可作为有价值的辅助工具,用于患者教育、医学生培训和临床决策支持。未来研究需要探索AI在实际临床环境中的长期影响,以及如何将其更好地整合到医疗工作流程中。
生物通微信公众号
知名企业招聘