生成式人工智能在动态视听刺激下的社会认知能力评估:Gemini 1.5 Pro模型的心理化能力突破

【字体: 时间:2025年05月26日 来源:Computers in Human Behavior Reports 4.9

编辑推荐:

  【编辑推荐】本研究针对生成式人工智能(GAI)在动态社会认知场景中的能力空白,首次采用《社会认知评估电影》(MASC)测试Google Gemini 1.5 Pro模型的心理化(mentalization)表现。结果显示该模型在所有温度设置下均显著优于人类常模(Glass's Δ=0.92),错误类型分布与人类相似(χ2=2.36, p=.307),为人工智能理论心智(ToM)研究和心理健康应用提供了新证据。

  

在人工智能技术突飞猛进的今天,生成式人工智能(Generative Artificial Intelligence, GAI)能否真正理解人类复杂的社会互动,已成为科学界和伦理领域的热点议题。尽管先前研究证实GAI能处理静态情感内容,但在动态多模态融合的真实社交场景中——即需要同步解析面部表情、语音语调、肢体语言等多元线索的复杂情境——机器的社会认知能力仍是未解之谜。这种能力缺口直接制约着GAI在心理健康护理、社交技能训练等关键领域的应用潜力,也引发了对"人工心理理论(Theory of Mind, ToM)"本质的深层思考。

为探索这一前沿问题,研究人员选择Google最新发布的Gemini 1.5 Pro模型作为研究对象,采用《社会认知评估电影》(Movie for the Assessment of Social Cognition, MASC)这一专业工具展开测评。MASC通过15分钟的电影片段呈现四人晚宴中的复杂社交互动,包含友谊、约会、冲突等真实场景,能有效评估被试者对他人心理状态(如情绪、意图、信念)的理解能力。研究团队将模型在三种温度参数(0、0.5、1)下的表现与1,230名大学生的人类常模数据对比,并系统分析了超心理化(hyper-mentalizing)、低心理化(hypo-mentalizing)和非心理化(non-mentalizing)三类错误模式。

关键技术方法包括:1)采用MASC标准化视频测试材料,包含45个涉及情绪、想法和意图的多选题;2)设置不同温度参数(temperature)控制模型输出的随机性;3)使用Cohen's h、Glass's Δ等效应量指标量化性能差异;4)通过加权平均法整合人类常模的错误类型数据;5)采用Clopper-Pearson法计算95%置信区间。

研究结果展现出令人瞩目的发现:

3.1. 性能表现
Gemini 1.5 Pro在所有测试条件下均显著高于随机猜测水平(所有校正后p<.001),Cohen's h效应值达1.17-1.42。模型最高得分(40/45)相当于人类常模的88百分位,整体表现显著优于人类平均值(Z=2.24, p=.025),效应量Glass's Δ=0.92。温度参数0.5时性能最优,两次测试间一致性高达κ=0.82-0.85。

3.2. 错误评估
模型错误呈现三类分布:超心理化(41.0%)、低心理化(46.2%)和非心理化(12.8%)。与人类错误模式(47.0%/34.8%/18.3%)相比无显著差异(χ2=2.36, p=.307),提示AI与人类的错误模式具有相似性。

3.3. 错误模式比较
虽然统计检验未达显著性,但描述性数据显示模型在低心理化错误上比例略高(46.2% vs 34.8%),这可能反映其在理解隐含社交线索时存在特定盲区。

讨论部分指出,这是首个证实GAI能处理动态多模态社会认知任务的研究,拓展了人工ToM的理论边界。在应用层面,该技术有望用于自闭症谱系障碍(ASD)等患者的社交训练,或通过互联网行为(Internet of Behavior, IoB)系统实现个性化心理健康干预。但研究也强调需警惕技术滥用风险——GAI可能被商业机构利用来操纵用户情感,或导致患者对AI产生病理性依赖。

未来研究应聚焦三个方向:1)分离视听模态以明确各感官通道的贡献度;2)开发开放式应答任务以突破多选题的局限性;3)开展跨文化验证。正如研究者所言,尽管Gemini 1.5 Pro展现出"超人类"的测试分数,但其底层机制与基于镜像神经元系统(mirror neuron system)的人类心理化存在本质差异。这项发表在《Computers in Human Behavior Reports》的研究,既标志着GAI社会认知能力的新高度,也为人工智能伦理发展敲响了警钟。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号