大型语言模型在精神科诊疗中的种族偏见:四项主流AI模型的定性比较研究

【字体: 时间:2025年06月05日 来源:npj Digital Medicine 12.4

编辑推荐:

  本研究针对AI在精神健康领域日益普及但可能加剧种族不平等的风险,由斯坦福大学团队主导,首次系统评估了Claude、ChatGPT、Gemini及本地医疗专用模型NewMes-v15在五种精神疾病诊断和治疗方案中的种族偏见。通过设计种族中立、暗示种族和明示非裔美国人身份的三种病例条件,研究发现LLMs(大型语言模型)在治疗方案中普遍存在种族偏见,尤以本地模型NewMes-v15表现最差。该成果发表于《npj Digital Medicine》,为AI医疗公平性评估提供了重要方法论和警示。

  

随着人工智能(AI)在医疗领域的快速渗透,大型语言模型(Large Language Models, LLMs)已成为精神科诊疗的潜在革新工具。然而,医疗AI系统中根深蒂固的种族偏见问题始终悬而未决——既往研究显示,AI在皮肤病诊断中会低估深色皮肤的病变风险,在肺功能评估中则可能高估非裔患者的肺部异常。当这类偏见延伸至本就依赖主观判断的精神科领域,其后果可能更为严峻:历史上,非裔患者被过度诊断为精神分裂症而漏诊情绪障碍的现象屡见不鲜。

斯坦福大学团队在《npj Digital Medicine》发表的研究首次系统揭示了主流LLMs在精神科诊疗中的种族偏见图谱。研究人员选取抑郁症、焦虑症、精神分裂症、进食障碍和注意力缺陷多动障碍(ADHD)这五种存在明确诊断差异的疾病,构建10个真实病例,通过巧妙设计"种族中立"(删除所有种族线索)、"种族暗示"(使用与非裔美国人高度关联的姓名)和"种族明示"(直接声明患者为非裔)三种条件,测试了Claude 3.5 Sonnet、ChatGPT-4o、Gemini 1.5 Pro及本地医疗专用模型NewMes-v15(基于LLaMA 3 8b微调)的响应差异。

关键技术方法包括:1)使用PubMed Central公开病例库构建三种种族条件的标准化提示;2)通过本地LLaMA 3.1 405B验证病例的种族线索去除效果;3)由社会心理学家和临床神经心理学家采用0-3分量表盲法评估120组输出的诊断和治疗偏差;4)采用Kruskal-Wallis检验比较模型间差异。

诊断评估中的种族差异
尽管所有模型在诊断推理过程中表现出相对一致性,但精神分裂症病例成为例外——当面对明示非裔身份的病例时,Claude和NewMes-v15的诊断偏差评分显著升高至1.5以上。值得注意的是,模型对"暗示种族"病例(仅通过姓名提示)的反应已显示出偏差倾向,证实LLMs能捕捉人类可能忽略的隐性种族线索。

治疗方案中的系统性偏见
治疗建议的种族差异更为触目惊心:在焦虑症病例中,Gemini仅对明示非裔患者强调戒酒建议;Claude对非裔抑郁症患者异常提出监护权建议;ChatGPT对非裔进食障碍患者额外添加物质滥用警告。最严重的偏见出现在ADHD治疗中——ChatGPT和NewMes-v15对非裔患者完全省略药物治疗方案,而在种族中立条件下则正常推荐。

模型间的性能梯度
NewMes-v15作为本地医疗专用模型表现最差,其治疗建议获得最高偏差评分(3分)的频率是其他模型的3倍。相反,Gemini展现出最强的抗偏能力,其整体偏差评分显著低于ChatGPT(P=0.005)和NewMes(P=0.00011)。这种差异突显了模型架构和训练数据对偏见传导的关键影响。

这项研究的重要发现在于:即使专门针对医疗场景优化的本地LLMs(如NewMes-v15),其偏见水平反而高于通用商业模型。这挑战了"领域专业化能自动降低偏见"的假设,提示当前医疗数据集中隐含的种族偏见可能通过微调过程被放大。研究者呼吁建立覆盖AI全生命周期的偏见监测体系,包括训练数据审计、实时输出校正工具开发等。

该成果的临床意义尤为深远——在缺乏实验室指标的精神科领域,LLMs可能通过细微的方言特征或姓名推断患者种族,进而输出带有偏见的治疗建议。随着医疗系统为节约成本转向本地化LLMs部署,这项研究为平衡技术便利性与医疗公平性敲响警钟。未来研究需探索更鲁棒的除偏策略,如对抗训练(adversarial training)与数据增强(data augmentation)的结合应用,才能真正实现AI辅助诊疗"不分肤色"的理想。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号