《BMC Medical Education》:Current practices and perceptions of ChatGPT in gynecologic oncology: results from a cross-sectional questionnaire (TRSGO-AI-001)
编辑推荐:
近年来,以ChatGPT为代表的大型语言模型(LLM)正迅速融入医学领域,但其在妇科肿瘤学(Gynecologic Oncology, GO)的实际应用现状与专业人员认知如何仍不明确。为此,研究人员开展了一项国际性的横断面问卷调查,旨在评估学术与临床场景下ChatGPT的应用实践、专业人员的认知及其感知的有效性。该研究发现,ChatGPT已被广泛认知并主要用于学术和教育任务,但在临床决策支持、患者沟通等方面的直接应用仍有限,且存在对错误信息的普遍担忧。该研究填补了相关数据空白,为评估人工智能在专科医疗实践中的角色和挑战提供了关键证据。
近年来,大型语言模型(Large Language Models, LLMs)如ChatGPT、Gemini等在各个领域掀起了巨大浪潮,其触角也伸向了严肃的医学界。妇科肿瘤学(Gynecologic Oncology, GO)——一个融合了手术、药物、放疗等多学科决策,并需兼顾生育力保存、安宁疗护等复杂沟通的领域——为评估这类AI工具提供了独特而重要的舞台。一方面,研究表明ChatGPT在撰写科学摘要、协助临床试验设计甚至模拟肿瘤多学科诊疗会议(Tumor Board)中展现了潜力,其生成的关于子宫颈癌的常见问题回答也显示出较高的准确性和满意度。另一方面,其在临床应用中潜藏的风险也引发关注,例如一项系统综述指出,在妇科肿瘤学领域,ChatGPT-4给出的治疗建议仅有75%与指南相符,且存在推荐过度基因检测的倾向。那么,在真实的医疗实践一线,面对卵巢癌、子宫内膜癌、宫颈癌等复杂病种,专业的妇科肿瘤学医生们到底如何看待和使用ChatGPT?是积极拥抱,还是谨慎观望?他们对这项技术在不同任务中的有效性评价如何?这项由土耳其研究人员团队主导、发表在《BMC Medical Education》上的研究,通过一项精心设计的在线问卷调查,为我们呈现了当前妇科肿瘤学领域专业人士对ChatGPT应用实践与认知的鲜活图景。
为探究上述问题,研究团队开展了一项国际性、横断面在线问卷调查。他们通过社交媒体、滚雪球抽样和科学社交网络在全球范围内招募了111名妇科肿瘤学领域的医疗专业人士。问卷设计包含23个条目,由两名非研究团队的资深妇科肿瘤学家独立审查。问卷内容涵盖人口学信息、对ChatGPT的认知、使用情况(包括在学术写作、文献综述、患者沟通、临床决策支持、教学和考试准备等六个领域的应用)、感知有效性、主要担忧以及对未来整合的看法。问卷采用双语(英语和土耳其语)呈现,并通过了严格的翻译质量保证流程。数据分析使用了SPSS统计软件,对分类变量采用卡方检验进行分析。
研究结果部分详细揭示了受访者的特征、ChatGPT的使用模式及专业人士的感知。
受访者特征:在最终分析的111名受访者中,绝大多数来自土耳其,平均年龄在36-45岁之间,且主要在学术机构工作。超过一半为妇科肿瘤专科医师。
认知与使用:结果显示,几乎所有受访者都听说过ChatGPT,三分之二的人表示曾在专业工作中使用过它。然而,其用途高度集中于学术支持任务:文献综述是最高频的应用,超过一半的受访者用其总结文献;其次是用于教学和学术写作。相比之下,其在临床场景的直接应用则少得多:仅17.1%的受访者将其用于肿瘤多学科诊疗会议准备或临床决策,用于患者沟通的比例更低至7.2%。
感知的有效性与担忧:研究人员让受访者评价ChatGPT在不同任务中的有效性。结果显示,ChatGPT在学术写作、文献综述和教学方面被认为具有中等至较高的有效性。然而,其在患者沟通、临床决策支持和考试准备方面的感知有效性则低得多,尤其是患者沟通领域,近半数受访者没有相关使用经验。谈及担忧,错误信息是受访者们最普遍报告的问题,高达66.7%的人将其列为主要顾虑,远超对数据隐私、过度依赖和伦理法律问题的担忧。
态度与倾向:尽管存在顾虑,超过60%的受访者认为ChatGPT对其专业工作有“有意义的贡献”。近半数受访者支持将其纳入妇科肿瘤学教育体系,且近六成人愿意向同事推荐使用。超过一半的受访者相信,像ChatGPT这样的人工智能工具未来将成为临床决策制定的标准组成部分。
使用模式的差异:进一步的分析揭示了有趣的群体差异。研究发现,年龄小于45岁以及临床经验不足5年的参与者,在专业活动中使用ChatGPT的频率显著更高。年轻医生也更频繁地将其用于临床决策。相反,临床经验更丰富的医生则更倾向于将ChatGPT用于写作目的。
讨论与结论部分对该研究的结果进行了深入解读,并将其置于更广泛的学术背景中进行了探讨。本研究是首批系统描绘妇科肿瘤学专业人士ChatGPT使用现状与认知的研究之一。结果清晰地展示了一幅“学术热情高,临床接纳缓”的图景。ChatGPT作为一种强大的文本处理工具,在辅助科研、教学等学术工作中得到了广泛认可和应用,这与之前系统综述的发现一致。然而,将其直接应用于涉及患者生命健康的核心临床决策时,医生们表现出了普遍的谨慎。这种谨慎主要源于对AI生成错误信息的担忧,以及临床决策本身的复杂性和高度情境化特性,这要求超越单纯信息检索的、细腻的专业判断。例如,尽管有研究显示ChatGPT-4o在回答子宫内膜癌患者问题时的准确性、同理心和完整性得分甚至超过了肿瘤科医生,但本研究的受访者们依然对其实用性持保留态度,这可能反映了现实中医患沟通的复杂性与AI目前能力的局限。
本研究也印证了不同背景医生在技术采纳上的差异。年轻、经验较少的医生更愿意在日常工作和临床决策中尝试使用新技术,这可能与他们的数字原生代背景和技术开放度有关。而高年资医生则更聚焦于利用其提升学术产出效率。此外,研究指出,ChatGPT在妇科肿瘤学不同亚专科的应用也存在差异,受访者最常将其用于子宫内膜癌相关的信息查询,这可能与该病种较高的发病率及日益复杂的分子分型和治疗指南有关,导致医生有更多的信息梳理需求。
综上所述,该研究得出结论:ChatGPT在妇科肿瘤学领域已被广泛认知,并主要作为一种有价值的辅助工具用于学术和教育任务,但其在患者沟通和临床决策支持等核心临床领域的应用仍然有限,且面临错误信息等关键挑战。这提示,虽然大型语言模型在提升学术效率和医学教育方面前景广阔,但在将其深度整合到临床实践之前,仍需在技术优化、准确性验证、伦理法规及患者安全等方面进行更深入的研究和规范。未来的研究方向应包括优化面向患者的模型应用、评估其在多学科团队诊疗中的整合效果,以及开展长期研究来评估其对临床工作流程、患者结局和医学教育质量的真实影响。