综述：评估AI构建者与使用者之间道德和多样性偏见的差异

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月06日 来源：Cognition 2.8

编辑推荐：

　　这篇综述揭示了AI开发者与用户群体在道德观（如功利主义倾向）和多样性偏好（通过AI调优任务AITT测量）上的系统性差异。研究采用横断面设计（N=914），发现男性及高AI参与度成人更倾向工具性伤害（instrumental harm）并弱化多样性支持，而青少年数据预示未来性别平衡可能缩小这一差距。成果为AI劳动力多元化（当前女性仅占22%）对技术伦理对齐（value alignment）的影响提供了首个实证支持，强调构建更具代表性的AI开发生态的必要性。

引言
教皇方济各在2024年G7峰会上指出，技术本质上是社会权力关系的具象化。这一观点在人工智能（AI）领域尤为凸显——当前AI开发者（builder）群体的人口同质性（78%为男性）引发了对技术价值偏离的担忧。本研究首次通过伪实验设计，实证检验了AI构建者与使用者在道德信念和多样性期待两个关键维度的差异。

方法学创新
研究采用牛津功利主义量表（OUS）和自创的AI调优任务（AITT），对519名成人（20-82岁）和395名青少年（15-19岁）进行评估。AITT模拟强化学习人类反馈（RLHF）流程，要求参与者对AI生成的40条多样性相关陈述（涉及性别、性取向等5个特征）进行±3分的奖惩，以此测量其对机器输出多样性的期待。

道德认知的性别鸿沟
数据显示，男性在工具性伤害（OUS子维度）上得分显著高于女性（成人B=0.39，p<0.001；青少年B=0.52，p<0.001），而女性更支持公正仁爱（impartial beneficence）。成人样本中，AI参与度每增加1级，功利主义总分上升0.12分（p<0.001），经性别加权后效应仍显著。这种差异在青少年群体中未显现，暗示未来代际价值观可能趋同。

多样性期待的代际反转
AITT任务揭示出有趣的反转现象：成年男性（B=-0.18，p<0.001）和高AI参与者（B=-0.03，p<0.001）对多样性支持较弱；而青少年中，对AI感兴趣的女生反而降低多样性评分（B=-0.07，p<0.001），男生则相反（B=0.04，p=0.037）。这种矛盾可能反映自我选择偏差——愿意进入男性主导领域的女性本身价值观更接近该群体。

劳动力构成的警示
当前AI行业女性占比仅22%，而青少年样本中未来拟从事AI工作的女性占33.3%，虽略有改善但仍失衡。研究同时发现，低社会经济地位（SES）青少年更少选择AI职业（B=-0.07，p=0.021），暗示行业多样性挑战的多维性。

技术伦理的实践启示
这些发现为AI伦理讨论提供了关键实证：

开发者群体的道德倾向可能通过设计选择、数据筛选和RLHF等环节嵌入系统，例如GPT-4在道德困境中表现出的"不妥协"立场（Takemoto，2024）
多样性态度差异可能导致算法偏见，如招聘AI弱化少数群体代表（Raji & Buolamwini，2019）
青少年数据表明，增加女性从业者或能自然改善价值对齐，但需警惕"逆向选择"带来的新偏差

未来方向
研究局限包括法国样本的地域局限，以及未直接测量AI系统输出。建议后续开展：

全球多中心验证，特别是非西方语境
开发者价值观与模型行为的映射研究
针对青少年职业选择的追踪调查

正如AI Now研究所强调，AI多样性危机本质是权力分配问题。本研究通过认知科学透镜，为构建更具包容性的技术未来提供了量化依据。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号