ChatGPT-4o与家庭医生在初级诊疗中的表现对比：一项关于患者常见问题的应答质量研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月14日 来源：International Journal of Medical Informatics 3.7

编辑推荐：

　　本研究针对AI在初级医疗中的应用难题，通过比较ChatGPT-4o与家庭医生对200例常见临床问题的应答质量，发现AI在适当性（5.8±0.5）、准确性（5.8±0.5）、全面性（2.4±0.6）及共情力（4.8±0.4）上均显著优于医生（p<0.01），为AI辅助医疗决策提供了实证依据。

在医疗资源紧张的时代，患者常常面临候诊时间长、医生沟通时间有限等问题。与此同时，以ChatGPT为代表的人工智能（AI）技术正迅速渗透到医疗领域，但其在初级诊疗中的实际应用效果尚缺乏系统评估。尤其值得注意的是，家庭医生需要同时具备专业医学知识和良好的沟通能力，这对AI系统提出了更高要求。

为解答这一问题，研究人员开展了一项开创性研究，比较ChatGPT-4o与家庭医生在回答200个常见临床问题时的表现差异。这项发表在《International Journal of Medical Informatics》的研究采用了严谨的实验设计：通过文献回顾和专家验证建立问题库，由三位经验丰富的家庭医生和ChatGPT-4o分别作答，再由三位独立专家对回答进行盲法评估。评估指标包括适当性（1-6分）、准确性（1-6分）、全面性（1-3分）和共情力（1-5分），同时记录回答字数。

研究结果显示，ChatGPT-4o在所有评估维度上均显著优于人类医生。在适当性方面，AI得分为5.8±0.5，明显高于医生的4.3±1.0；准确性评分同样呈现优势（5.8±0.5 vs 4.5±1.1）。特别值得注意的是，在通常被认为需要"人性化"的共情力维度，ChatGPT-4o仍以4.8±0.4的得分领先于医生的4.0±0.8。唯一例外是在"常规咨询"和"儿童感染"两个主题上，AI的优势未达统计学显著性（p=0.07，0.08）。

在讨论部分，研究者指出这些发现具有多重意义：首先，证实了AI在提供标准化医疗信息方面的优势；其次，AI的长篇幅回答（平均298.8±82.3字）可能更有利于患者教育；最后，在保持共情力方面的表现打破了"AI缺乏人文关怀"的刻板印象。不过，研究者也强调需要进一步优化AI回答的简洁性和文化适应性。

这项研究为AI在初级医疗中的应用提供了重要参考，提示ChatGPT-4o可作为有价值的辅助工具，用于患者教育、医学生培训和临床决策支持。未来研究需要探索AI在实际临床环境中的长期影响，以及如何将其更好地整合到医疗工作流程中。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号