ChatGPT与人类对虚幻面孔感知的比较研究：性别偏差与情绪识别的认知机制解析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月15日 来源：Visual Cognition 1.4

编辑推荐：

　　这篇研究通过四项实验系统比较了ChatGPT与人类对虚幻面孔（face pareidolia）的感知差异，发现AI在性别判断中存在与人类相似的"男性偏差"（male bias），且在情绪（如恐惧误判为惊讶）和年龄识别上与人类模态反应显著关联（κ=0.14-0.55）。研究为探索人类与算法（GPT-4V）的面部处理过度泛化机制提供了新视角。

虚幻面孔感知的跨物种比较

当人类将螺栓孔视为眼睛、奶酪孔洞看作嘴巴时，这种将无生命物体误认为面孔的现象被称为"虚幻面孔"（face pareidolia）。研究表明，这种现象不仅存在于人类和非人灵长类动物中，最新证据表明人工智能系统ChatGPT同样具备这种感知能力。

实验设计与方法论革新

研究团队采用Wardle等人2022年创建的256个虚幻面孔数据集，通过四组精巧实验设计：首先验证ChatGPT的面部检测能力（实验1），继而分析其性别判断（实验2A/B）、情绪识别（实验3）和年龄评估（实验4）与人类模态反应的关联性。值得注意的是，为避免顺序效应，每个实验均在独立对话中完成，并关闭了ChatGPT的记忆功能。

关键发现与认知机制

在面部检测方面，ChatGPT表现出惊人的敏感性——96.9%的虚幻面孔被明确识别，其描述性解释（如"螺栓孔形成惊讶表情"）与人类感知高度吻合（κ=0.14）。性别判断实验揭示出显著"男性偏差"：83.3%的判断与人类一致，其中80%归类为男性。有趣的是，后续实验（2B）通过100次"想象行人"测试，排除了"person=male"的概念关联假说（p=0.764），暗示这种偏差可能源于视觉特征默认机制。

情绪识别方面，ChatGPT展现出与人类相似的错误模式——64.5%的情绪分类与人类模态反应一致（κ=0.55），但特别容易将恐惧误判为惊讶，这与人类面部处理的经典困境高度吻合。年龄评估实验则显示71.9%的一致性（κ=0.40），且存在将快乐表情面孔判断为年轻的倾向。

技术局限与学术价值

研究存在若干方法论限制：①人类原始数据存在判断分歧（如某图像仅34%认为快乐）；②ChatGPT的"字面理解"特性迫使研究者移除"无面孔"选项；③训练数据可能包含部分实验图像。然而，这些局限恰恰凸显了人机认知比较研究的独特挑战——如何平衡算法的确定性输出与人类判断的天然变异性。

转化应用与未来方向

该研究开辟了多个创新研究方向：1）利用ChatGPT的图像生成功能探究"男性偏差"的视觉特征基础；2）分析网络表情数据量与AI识别准确度的关联；3）开发人机协同的面部识别增强系统。特别值得注意的是，ChatGPT在恐惧-惊讶混淆模式上与人类的高度相似性，为探索情绪识别的跨物种神经机制提供了数字化模型。

伦理启示与学术争议

作者特别强调，虽然ChatGPT的认知偏差可能反映人类社会的潜在偏见（如男性默认效应），但其内在机制可能与人类截然不同。这种"形似神异"的特性，使得AI系统既能成为研究人类认知的镜子，又可能成为揭示算法黑箱的探针。随着GPT-4V等多模态模型的发展，此类比较研究将在认知科学、计算机视觉和伦理学的交叉领域产生深远影响。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号