大型语言模型在长期护理记录中的性别偏见评估:Llama 3与Gemma的对比研究

【字体: 时间:2025年08月12日 来源:BMC Medical Informatics and Decision Making 3.8

编辑推荐:

  本研究针对大型语言模型(LLMs)在长期护理记录自动摘要中潜在的性别偏见问题,通过对比Meta的Llama 3和Google Gemma等2024年最新开源模型,发现Gemma存在显著性别差异,男性摘要更强调健康问题且语言更直接,而女性需求常被弱化。该研究为医疗AI公平性评估提供了可量化框架,对减少护理服务分配偏差具有重要实践意义。

  

随着人工智能在医疗领域的快速渗透,大型语言模型(LLMs)正被用于自动生成长期护理记录摘要,以缓解医护人员文档负担。然而,这些"数字助手"可能暗藏危险——已有研究表明,LLMs会放大训练数据中的社会偏见,当这种偏见涉及性别时,可能直接影响护理服务的公平分配。在伦敦某地方政府辖区,69%的老年人护理记录存在长达十年的文本积累,工作人员常因信息过载错过关键细节。尽管美国总统拜登2023年行政令和英国2024年春季预算都大力推动医疗AI应用,但欧盟《人工智能法案》同时警示:未经充分评估的AI系统可能造成"分配性伤害"——即因算法偏见导致不同群体获得差异化的服务。

来自伦敦政治经济学院(LSE)Personal Social Services Research Unit的研究人员Sam Rickman团队,在《BMC Medical Informatics and Decision Making》发表的最新研究中,对617份伦敦地区老年人护理记录进行性别互换处理,系统评估了Llama 3和Gemma等四代LLMs的性别偏见。令人惊讶的是,号称"当前最先进开源模型"的Gemma表现出最显著的性别差异:男性摘要中"残疾"(disabled)出现18次而女性仅1次,"复杂医疗史"(complex medical history)等诊断描述也更频繁出现;女性摘要则充斥"文本描述"(the text describes)等间接表达,需求常被"尽管"(despite)等弱化词修饰。相比之下,Llama 3在所有指标上均未显示性别差异。

研究采用三大关键技术:1)反事实公平框架,通过性别互换文本生成29,616组对比数据;2)多维度偏见检测,结合SiEBERT情感分析和Regard偏见度量指标;3)主题-词频联合分析,构建包含物理健康、心理健康等4类主题词库进行χ2检验。所有分析通过混合效应模型(含文档ID随机效应)控制变量,p值经Benjamini-Hochberg校正。

研究结果揭示

反事实公平性验证:Gemma男性摘要的负面情感得分显著更高(β=0.87, p<0.001),而Llama 3无性别差异(p=0.25)。

主题偏差:Gemma男性摘要中"痴呆"(dementia)、"感染"(infection)等医学术语出现频率是女性的1.6倍,且更倾向使用"无法"(unable)等绝对表述(χ2=214.3, adj.p<0.001)。

语言风格差异:女性摘要中"文本"(text)、"描述"(describe)等元语言词汇超频出现(5042 vs 2726次),暗示模型更关注文本本身而非个体需求。

讨论与意义

该研究首次证实:不同LLMs的性别偏见存在显著异质性——2019年的BART模型主要表现为"包含性偏见"(如女性摘要额外添加"做出不明智决定"等主观评价),而2024年的Gemma则展现更隐蔽的"语言性偏见"。这种差异可能源于模型架构:Gemma基于Gemini技术优化,其多模态训练数据可能隐含社会刻板印象。

在实践层面,研究提出的三阶段评估框架(反事实测试-主题映射-词频验证)为监管机构提供了可操作的AI公平性审计工具。鉴于护理服务基于需求分配,Gemma等模型若弱化女性健康问题(如将男性"谵妄、胸部感染和新冠"描述为女性"健康并发症"),可能加剧现有健康差距。值得警惕的是,合成数据测试重现了真实数据的偏差模式,证实该现象具有跨数据集的稳健性。

这项研究为正在制定中的全球医疗AI监管政策提供了关键证据:欧盟《AI法案》要求的"高风险系统"评估应包含此类反事实测试。团队开源的全部代码(GitHub可获取)使地方政府能以最小成本实施本地化评估。正如作者强调:"当AI生成的摘要成为官方记录的一部分,算法公平性就不再是技术问题,而是公共卫生伦理的核心议题。"

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号