
-
生物通官微
陪你抓住生命科技
跳动的脉搏
文本到图像生成AI中性别与种族偏见:澳大利亚急救人员形象再现的实证研究
【字体: 大 中 小 】 时间:2025年05月15日 来源:Australasian Emergency Care 2.1
编辑推荐:
本研究针对DALL-E 3文本到图像生成AI在描绘澳大利亚急救人员时存在的性别与种族偏见问题展开分析。研究人员通过生成82张图像(含326个角色),发现90.8%被描绘为男性、90.5%为白种人、95.7%为浅肤色,与真实 workforce数据存在显著差异(p<0.001)。该研究揭示了AI技术对职业形象再现的系统性偏差,对急救服务领域的文化安全建设具有警示意义。
在人工智能技术席卷全球的浪潮中,文本到图像生成系统如DALL-E 3正深刻改变着视觉内容的创作方式。然而,当这些算法描绘具有社会意义的职业形象时,其潜在的偏见问题逐渐浮出水面。以澳大利亚急救领域为例,尽管女性已占paramedics(急救医护人员)总数的49.1%,但传统媒体仍延续着男性主导的刻板印象。更令人担忧的是,新兴的生成式人工智能(Generative AI)可能通过"符号性抹除"(symbolic annihilation)进一步加剧这种偏差——即系统性忽视特定群体在社会叙事中的存在。
这种技术偏差带来的后果不容小觑。急救服务的公众形象直接影响着职业吸引力与社区信任度,而失真的AI生成图像可能强化历史遗留的性别与种族偏见。尤其值得关注的是,澳大利亚paramedicine(急救医学)在2018年才正式成为注册健康职业,正处于专业形象重塑的关键期。在此背景下,研究人员开展了一项开创性研究,旨在客观评估DALL-E 3在描绘澳大利亚first responders(第一响应者:包括paramedics、警察和消防员)时存在的系统性偏差。
研究团队采用严谨的实验设计,在2024年3月通过GPT-4集成的DALL-E 3生成82张图像(含60张个体图像和22张群体图像),共包含326个角色。所有图像由三位评审独立分析角色的表观性别、年龄、肤色(采用Massey-Martin NIS Skin Color Scale分级)和种族特征。统计分析采用Pearson卡方检验(Chi-Square test)和似然比卡方检验(Likelihood Ratio Chi-Square test),显著水平设定为p<0.05。
研究结果触目惊心。在个体paramedics图像中,DALL-E 3竟100%将其描绘为男性、白种人和浅肤色。整体数据显示,90.8%(N=296)的第一响应者被呈现为男性,90.5%(N=295)为白种人,95.7%(N=312)为浅肤色。与澳大利亚实际workforce数据相比,paramedics和警察的性别分布差异具有统计学意义(p<0.001)。更微妙的是,即便在群体图像中出现少数女性形象,她们往往被边缘化——处于画面次要位置而非核心角色。
年龄分布同样呈现显著偏差。94.8%(N=309)的角色被描绘为55岁以下,远高于现实中的年龄结构。这种"永恒青年"的呈现方式,可能进一步强化急救行业对体能要求的刻板认知,间接阻碍成熟从业者的职业发展。值得注意的是,不同急救职业间(paramedics、警察、消防员)的肤色与种族偏差无统计学差异,表明这种偏见是跨职业的系统性问题。
讨论部分尖锐指出,DALL-E 3的偏见根源在于其训练数据内嵌的历史性和制度性偏差。尽管AI技术本可用于纠正传统媒体中的失衡现象,但未经调控的应用反而放大了"符号性抹除"效应。这种偏差对文化安全(cultural safety)构成双重威胁:既阻碍女性与少数族裔从业者的职业认同,又影响多元化社区对急救服务的信任度。
该研究的创新价值在于首次系统评估了生成式AI对澳大利亚急救行业形象的再现偏差,并采用群体图像与个体图像相结合的分析方法,较既往研究更具说服力。研究者建议,通过精细的prompt engineering(提示词工程)和严格的图像审核,或可扭转AI的偏见输出,使其成为促进职业形象多元化的工具。
这项发表在《Australasian Emergency Care》的研究为AI伦理领域敲响警钟。在技术日新月异的今天,我们必须警惕算法对社会认知的潜在形塑作用——特别是对急救服务等关乎公共安全的关键领域。该研究不仅为AI开发者提供了改进方向,也为急救行业的形象管理策略提供了实证依据,其方法论更可拓展至其他存在职业刻板印象的领域。
生物通微信公众号
知名企业招聘