评估ChatGPT、Gemini以及在鼻整形修复咨询中专家外科医生的见解

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Aesthetic Plastic Surgery》：Evaluating the Insights of ChatGPT, Gemini and Expert Surgeons in Revision Rhinoplasty Consultation

【字体：大中小】 时间：2025年12月10日 来源：Aesthetic Plastic Surgery 2.8

编辑推荐：

　　人工智能聊天机器人ChatGPT和Gemini在鼻整形修复咨询中的表现优于专家外科医生，尤其在同理心和沟通技能方面差异显著，但专家在精确度上更优。研究指出LLM在医疗应用中仍存在潜在风险。

摘要

研究目的

本研究旨在评估和比较两种大型语言模型（LLM）聊天机器人ChatGPT和Gemini在鼻整形术修复咨询过程中所提供的回答与专业外科医生的回答。鉴于修复病例中的情感复杂性以及相对较低的满意度，评估AI在提供富有同情心和准确信息方面的有效性至关重要。

材料与方法

向ChatGPT、Gemini以及两位专业外科医生提出了一组反映患者关切的假设性问题。四位学术耳鼻喉科医生使用5点李克特量表对回答进行了同情心、准确性、完整性和沟通技巧方面的评分。通过单因素方差分析（one-way ANOVA）和Bonferroni检验来分析评分的统计显著性。

结果

ChatGPT在所有类别中均获得了最高的平均分数，在同情心、准确性、完整性和沟通技巧方面显著优于两位专业外科医生（p < 0.01）。Gemini在这些类别中也表现优于专业外科医生。值得注意的是，ChatGPT在完整性方面表现更为出色，而专业外科医生1在准确性方面表现更佳。评估者在准确性、完整性和沟通技巧方面的评分较为一致，但在同情心方面存在显著差异（p < 0.01）。

结论

ChatGPT和Gemini在鼻整形术修复咨询中表现出了出色的能力。然而，LLM聊天机器人存在一些已知的局限性；它们在面部整形手术和医疗系统中的作用可能尚未得到充分控制。

证据等级IV

本期刊要求作者为每篇文章指定一个证据等级。有关这些基于证据的医学评级的完整说明，请参阅目录或在线作者指南 www.springer.com/00266。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号