综述:机器翻译中的性别偏见十年

【字体: 时间:2025年05月03日 来源:Patterns 6.7

编辑推荐:

  本文回顾了过去十年机器翻译(MT)中性别偏见的研究。研究发现早期期望快速解决问题的乐观态度已被更复杂的现实取代。虽然取得了一些进展,但仍存在诸多挑战。文章探讨了当前大语言模型(LLMs)带来的机遇和挑战,并为未来研究提供方向。

  

引言


自 2014 年 Londa Schiebinger 教授指出机器翻译中存在性别偏见问题,十年过去了。这期间,社会、语言和技术都发生了巨大变化。随着大语言模型(LLMs)驱动的多语言技术日益普及,确保技术的包容性至关重要,因为性别偏见会导致不平等的表现、错误的性别标注以及服务差异,对边缘化群体产生不利影响。本文回顾了过去十年关于机器翻译性别偏见的研究,探讨了当前 LLMs 兴起背景下的研究现状,旨在为该领域未来的研究提供启发。

背景


MT 技术进展


机器翻译(MT)是自然语言处理(NLP)和计算语言学领域的重要应用。近年来,MT 核心技术发展迅速,从基于短语的统计机器翻译(SMT)逐渐发展为神经机器翻译(NMT),如今 LLMs 在翻译领域崭露头角。LLMs 可支持多种任务,在零样本和少样本设置下进行翻译,展现出强大的能力,且通过指令微调,有望成为专用监督 NMT 模型的有力竞争者。

性别与语言的关系


性别在语言中是一个复杂的概念,与社会文化和政治观念相互作用。在语法性别语言中,如德语、西班牙语和意大利语,性别形态广泛存在,职业领域中女性头衔的认可长期存在争议。使用男性化头衔可能引发无意识偏见,影响女性在相关角色中的实际表现。为促进包容性,性别中立形式和创新表达方式不断涌现,但在(机器)翻译场景中,由于不同语言对性别的编码和表达方式不同,翻译性别变得更加复杂,可能导致不平等的表现和潜在危害。

自动翻译中性别偏见的综述


综述方法


为系统回顾先前研究,作者遵循 PRISMA 2020 清单,在 ACL 文集、ACM FAccT 会议论文集中进行检索,最终筛选出 133 篇符合标准的论文进行详细注释和分析。

综述结果


  1. 研究领域的增长:关于机器翻译中性别偏见的研究论文数量总体呈上升趋势,2023 年达到峰值,但 2024 年略有下降,可能是研究重点转向 LLMs 在多任务中的偏见研究。
  2. 缺乏社会参与:现有研究常忽视偏见的社会成分和原因,多数将其视为数据驱动的技术问题或纯粹的跨语言问题,未充分考虑偏见产生的背景和下游影响。
  3. 涉及所有 MT 范式:性别偏见研究涵盖了所有最新的 MT 范式,包括 SMT、NMT 和 LLMs。尽管技术不断发展,但性别偏见仍然是机器翻译技术面临的关键挑战。
  4. 文本到文本是主导模态:大多数研究集中在文本模态,对音频和视觉翻译的研究较少,且多数研究关注句子级别的翻译,忽视了上下文的重要性。
  5. 多种缓解策略但无明显优势:近一半的论文提出了缓解性别偏见的策略,但这些策略大多针对特定挑战和语言,缺乏通用性,尚未有明显的最优策略。
  6. 少数资源丰富的语言:研究主要集中在少数几种资源丰富的语言对,尤其是涉及英语的翻译,对其他语言的研究较少。
  7. 对性别的有限二元处理:多数论文将性别视为二元类别,近年来虽有一些研究开始关注非二元性别身份,但仍需进一步加强。
  8. 缺乏交叉性研究:很少有研究考虑性别属性与其他社会人口学因素的相互作用,这可能导致对歧视问题的理解不全面。
  9. 缺乏用户参与:在机器翻译性别偏见研究中,缺乏直接的用户参与,多数研究依赖人工评估和实验场景,未能充分反映真实世界的使用情况和用户需求。

讨论


偏见能否被消除?


尽管对性别偏见的研究持续增长,但问题仍未得到解决。现有研究大多以英语为中心,局限于文本到文本的系统,忽视了不同语言、文化和社会背景的差异。此外,研究缺乏对现实场景的关注,未充分考虑受影响人群和各种歧视因素。偏见是一个社会技术问题,具有动态性和复杂性,难以通过单一的技术干预解决。因此,需要不断适应社会、语言、上下文和技术的变化,以减少对边缘化性别群体的危害。

机遇与挑战


  1. 多语言和多元文化:LLMs 的出现为跨多种语言的研究提供了可能,但目前许多流行的 LLMs 在英语中表现最佳,且可能编码西方视角,导致文化同质化。研究性别偏见需要考虑不同文化背景下性别的差异,避免语言和文化偏见的传播。
  2. 偏见的多维性和语言建模:MT 性别偏见研究主要集中在文本模态,而随着多模态系统的兴起,翻译将更多地依赖非文本信息。这需要重新审视偏见的形式化定义,考虑多模态因素对性别和身份表达的影响,以及与其他歧视因素的交叉作用。
  3. 以用户为中心的现实评估:当前研究缺乏直接的用户参与,实验场景和基准测试无法反映真实世界的使用情况。未来研究应关注用户的实际体验和需求,采用参与式方法和人机交互(HCI)方法,确保性别偏见调查与技术的实际应用相结合。
  4. 语言创新和数据管理:随着对非二元身份的认识不断提高,MT 需要更好地处理新兴的非二元语言表达。LLMs 虽有一定优势,但在处理二元与非二元形式方面仍存在差距。通过数据管理和训练,可以提高模型对边缘化身份的表示能力,但如何满足不同用户的偏好仍是一个挑战。
  5. 个性化:用户对公平解决方案的偏好存在差异,个性化是 MT 研究的一个重要方向。LLMs 可以通过学习用户偏好来更好地满足个体需求,但个性化也带来了伦理和隐私方面的挑战,需要确保在负责任和透明的框架下进行。

结论


性别偏见在 MT 领域已受到关注十余年,虽取得了一些进展,但仍存在诸多问题。偏见是一个复杂的社会技术问题,无法通过单一技术解决。LLMs 的兴起带来了新的机遇和挑战,未来研究需要考虑社会、语言、上下文和技术的变化,以减少对边缘化性别群体的危害。本文为未来研究提供了参考,旨在推动持续努力,减轻 MT 对社会的负面影响。

研究的局限性


本文的综述仅考虑了 ACL 文集中的同行评审论文,尽管该文集涵盖了 MT 领域的大部分重要文献,但可能仍存在遗漏。此外,所有作者均来自欧洲白人背景,这可能影响对语言背景和偏见概念的理解,在选择示例和构建偏见框架时,可能未充分考虑代表性不足的语言和文化背景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号