综述:评估AI构建者与使用者之间道德和多样性偏见的差异

【字体: 时间:2025年06月06日 来源:Cognition 2.8

编辑推荐:

  这篇综述揭示了AI开发者与用户群体在道德观(如功利主义倾向)和多样性偏好(通过AI调优任务AITT测量)上的系统性差异。研究采用横断面设计(N=914),发现男性及高AI参与度成人更倾向工具性伤害(instrumental harm)并弱化多样性支持,而青少年数据预示未来性别平衡可能缩小这一差距。成果为AI劳动力多元化(当前女性仅占22%)对技术伦理对齐(value alignment)的影响提供了首个实证支持,强调构建更具代表性的AI开发生态的必要性。

  

引言
教皇方济各在2024年G7峰会上指出,技术本质上是社会权力关系的具象化。这一观点在人工智能(AI)领域尤为凸显——当前AI开发者(builder)群体的人口同质性(78%为男性)引发了对技术价值偏离的担忧。本研究首次通过伪实验设计,实证检验了AI构建者与使用者在道德信念和多样性期待两个关键维度的差异。

方法学创新
研究采用牛津功利主义量表(OUS)和自创的AI调优任务(AITT),对519名成人(20-82岁)和395名青少年(15-19岁)进行评估。AITT模拟强化学习人类反馈(RLHF)流程,要求参与者对AI生成的40条多样性相关陈述(涉及性别、性取向等5个特征)进行±3分的奖惩,以此测量其对机器输出多样性的期待。

道德认知的性别鸿沟
数据显示,男性在工具性伤害(OUS子维度)上得分显著高于女性(成人B=0.39,p<0.001;青少年B=0.52,p<0.001),而女性更支持公正仁爱(impartial beneficence)。成人样本中,AI参与度每增加1级,功利主义总分上升0.12分(p<0.001),经性别加权后效应仍显著。这种差异在青少年群体中未显现,暗示未来代际价值观可能趋同。

多样性期待的代际反转
AITT任务揭示出有趣的反转现象:成年男性(B=-0.18,p<0.001)和高AI参与者(B=-0.03,p<0.001)对多样性支持较弱;而青少年中,对AI感兴趣的女生反而降低多样性评分(B=-0.07,p<0.001),男生则相反(B=0.04,p=0.037)。这种矛盾可能反映自我选择偏差——愿意进入男性主导领域的女性本身价值观更接近该群体。

劳动力构成的警示
当前AI行业女性占比仅22%,而青少年样本中未来拟从事AI工作的女性占33.3%,虽略有改善但仍失衡。研究同时发现,低社会经济地位(SES)青少年更少选择AI职业(B=-0.07,p=0.021),暗示行业多样性挑战的多维性。

技术伦理的实践启示
这些发现为AI伦理讨论提供了关键实证:

  1. 开发者群体的道德倾向可能通过设计选择、数据筛选和RLHF等环节嵌入系统,例如GPT-4在道德困境中表现出的"不妥协"立场(Takemoto,2024)
  2. 多样性态度差异可能导致算法偏见,如招聘AI弱化少数群体代表(Raji & Buolamwini,2019)
  3. 青少年数据表明,增加女性从业者或能自然改善价值对齐,但需警惕"逆向选择"带来的新偏差

未来方向
研究局限包括法国样本的地域局限,以及未直接测量AI系统输出。建议后续开展:

  • 全球多中心验证,特别是非西方语境
  • 开发者价值观与模型行为的映射研究
  • 针对青少年职业选择的追踪调查

正如AI Now研究所强调,AI多样性危机本质是权力分配问题。本研究通过认知科学透镜,为构建更具包容性的技术未来提供了量化依据。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号