
-
生物通官微
陪你抓住生命科技
跳动的脉搏
同行视角下生成式AI在医疗决策中的应用对临床医生评价的影响
【字体: 大 中 小 】 时间:2025年08月20日 来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对生成式人工智能(GenAI)在医疗决策中的应用如何影响同行评价这一关键问题展开。研究人员通过随机对照实验,比较了276名临床医生对三种情境(未使用GenAI、将GenAI作为主要决策工具、将GenAI作为验证工具)下同行医生的评价差异。结果显示,使用GenAI作为主要决策工具的医生在临床技能(均值3.79 vs 5.93)、整体医疗体验和胜任力评价上显著降低,而将GenAI定位为验证工具可部分缓解这种负面评价(均值4.99)。该研究揭示了AI工具临床应用中的声誉风险,为医疗AI的合理部署提供了重要参考。
随着ChatGPT等生成式人工智能(GenAI)系统的兴起,医疗领域正经历着前所未有的技术变革。截至2024年初,超过70%的医疗机构已开始将GenAI整合到工作流程中。从MYCIN专家系统到IBM Watson,医疗决策支持工具的发展历程充满坎坷,而GenAI凭借其处理非结构化数据和生成类人响应的能力,被视为改变游戏规则的技术。然而在这股技术热潮背后,一个关键问题被长期忽视:当医生使用这些"智能助手"做决策时,同行们会怎么看待他们的专业能力?
这项发表在《npj Digital Medicine》的研究揭开了这个"AI使用的社会心理学困境"。研究团队设计了一个精巧的随机对照实验:邀请约翰霍普金斯医疗系统的276名临床医生(包括178名医师和60名高级实践提供者)阅读三种不同版本的糖尿病管理案例。在"对照组"场景中,医生完全依靠自身判断;"GenAI主要工具组"中医生明确使用AI做决策;"GenAI验证组"则强调AI仅用于验证已有判断。通过标准化问卷,研究人员测量了同行对案例中医生的临床技能、整体医疗体验质量和整体胜任力的评价。

研究采用多变量方差分析和中介效应检验等统计方法,发现使用GenAI作为主要决策工具的医生遭遇了显著的"能力折扣效应"——其临床技能评分比对照组低36%(3.79 vs 5.93,p<0.001),这种负面评价通过临床技能的中介作用进一步影响了整体胜任力判断(β=-1.93)。有趣的是,当AI被定位为"验证工具"时,这种负面评价减轻了约32%,但仍未恢复到基线水平。这表明同行似乎能接受AI作为"第二双眼睛",但难以认同其主导决策过程。
在更深层的分析中,研究揭示了两个看似矛盾的现象:一方面,参与者普遍认可GenAI能提升诊断准确性(均值4.30)且机构定制版AI更受青睐(均值4.96);另一方面,他们又不愿给予使用这些工具的同行太高评价。这种认知分裂可能源于医疗行业根深蒂固的专业文化——临床技能长久以来被视为医师专业身份的核心,而过度依赖外部工具可能被视为对这种专业自主性的威胁。
该研究的现实意义不言而喻。在医疗转诊网络中,同行评价直接影响医生的职业发展机会和患者来源。研究发现暗示,不加说明地使用AI工具可能无意中损害医生的专业声誉,进而阻碍技术创新在临床实践中的渗透。这为医疗AI开发者提出了重要挑战:如何在提升诊断准确性的同时,设计出能维护使用者专业形象的人机交互模式?研究建议,明确将AI定位为"验证工具"而非"决策者",可能是当前阶段更易被接受的过渡方案。
这项研究也存在若干局限:仅采用糖尿病单一病种案例可能限制结论的普适性;未考虑不同专科对AI接受度的差异;且仅聚焦同行评价而未涉及患者视角。未来研究可拓展到更多临床场景,并探索如何通过培训改变医生对AI使用的刻板印象。随着GenAI在医疗中的应用日益深入,如何在技术创新与专业认同间找到平衡点,将成为数字医疗时代的重要课题。
生物通微信公众号
知名企业招聘