
-
生物通官微
陪你抓住生命科技
跳动的脉搏
评估ChatGPT、Gemini以及在鼻整形修复咨询中专家外科医生的见解
《Aesthetic Plastic Surgery》:Evaluating the Insights of ChatGPT, Gemini and Expert Surgeons in Revision Rhinoplasty Consultation
【字体: 大 中 小 】 时间:2025年12月10日 来源:Aesthetic Plastic Surgery 2.8
编辑推荐:
人工智能聊天机器人ChatGPT和Gemini在鼻整形修复咨询中的表现优于专家外科医生,尤其在同理心和沟通技能方面差异显著,但专家在精确度上更优。研究指出LLM在医疗应用中仍存在潜在风险。
本研究旨在评估和比较两种大型语言模型(LLM)聊天机器人ChatGPT和Gemini在鼻整形术修复咨询过程中所提供的回答与专业外科医生的回答。鉴于修复病例中的情感复杂性以及相对较低的满意度,评估AI在提供富有同情心和准确信息方面的有效性至关重要。
向ChatGPT、Gemini以及两位专业外科医生提出了一组反映患者关切的假设性问题。四位学术耳鼻喉科医生使用5点李克特量表对回答进行了同情心、准确性、完整性和沟通技巧方面的评分。通过单因素方差分析(one-way ANOVA)和Bonferroni检验来分析评分的统计显著性。
ChatGPT在所有类别中均获得了最高的平均分数,在同情心、准确性、完整性和沟通技巧方面显著优于两位专业外科医生(p < 0.01)。Gemini在这些类别中也表现优于专业外科医生。值得注意的是,ChatGPT在完整性方面表现更为出色,而专业外科医生1在准确性方面表现更佳。评估者在准确性、完整性和沟通技巧方面的评分较为一致,但在同情心方面存在显著差异(p < 0.01)。
ChatGPT和Gemini在鼻整形术修复咨询中表现出了出色的能力。然而,LLM聊天机器人存在一些已知的局限性;它们在面部整形手术和医疗系统中的作用可能尚未得到充分控制。
本期刊要求作者为每篇文章指定一个证据等级。有关这些基于证据的医学评级的完整说明,请参阅目录或在线作者指南 www.springer.com/00266。
生物通微信公众号
知名企业招聘