编辑推荐:
日常生活中,视觉场景能引发情感,但情感图式的形成机制不明。研究人员收集 4913 个场景的情感评分,对比 AlexNet 和 EmoNet 模型。结果发现 AlexNet 更擅预测日常场景情感评分,情感信息在物体识别系统分层处理。这揭示了情感处理机制。
在日常生活里,我们看到不同的场景和物体时,内心会涌起各种各样的情绪。比如看到美食会产生渴望,看到蜘蛛可能会感到恐惧。这些情绪的产生看似平常,背后却隐藏着复杂的神经和计算机制。一直以来,科学家们都在探索视觉场景引发多样情感的奥秘,可究竟情感图式(emotion schemas,即感官特征与情感之间的联系 )是依赖物体处理系统,还是能独立提取,始终没有明确答案。为了揭开这个谜团,南京师范大学的研究人员展开了一项极具意义的研究,相关成果发表在《Communications Biology》上。
这项研究意义重大。如果能弄清楚情感和物体识别之间的关系,就能更好地理解人类的认知和情感过程,对于心理学、神经科学等领域的发展都有极大的推动作用。比如说,在人工智能领域,若能模拟人类基于物体识别产生情感的机制,就能让机器更懂人类的情感,实现更人性化的交互。
为了开展研究,研究人员可谓做了精心准备。他们从 BOLD5000 公共 fMRI 数据集中选取了 4913 张图片,这些图片涵盖了室内外场景、复杂物体交互等多种类型。研究人员邀请了 300 名志愿者,让他们观看这些图片并进行情感评分,从 20 种情感类别(如崇拜、审美欣赏、厌恶等)中选择能描述自身感受的类别 。同时,研究人员运用了功能磁共振成像(fMRI)技术,收集志愿者观看图片时大脑的活动数据。另外,他们还借助深度卷积神经网络模型 AlexNet 和 EmoNet 来分析数据,对比这两个模型预测情感评分的能力。
下面来看看具体的研究结果:
- 物体表征预测日常生活场景的情感评分:研究人员用 AlexNet 和 EmoNet 模型预测情感评分。结果显示,AlexNet 的 fc8 层(平均留一法交叉验证 r = 0.407,p < 0.001)和 EmoNet 的 fc8 层(平均留一法交叉验证 r = 0.292,p < 0.001)都能显著预测情感评分,但 AlexNet 表现更优(Δr = 0.115,p < 0.001) 。在预测 Cowen 和 Keltner 数据集中图片的情感评分时,EmoNet 则更胜一筹。这表明 EmoNet 在预测明确引发情感的刺激时表现出色,而 AlexNet 在捕捉更广泛的日常场景情感反应上更具优势。
- 情感信息在物体识别系统的分层阶段处理:研究人员通过 PLSR 分析 AlexNet 各层激活与情感评分的关系,发现各层都能预测情感评分,且随着层数加深,预测能力单调提升。在分析 BOLD5000 数据集的不同子集和 Cowen17 数据集时,都能观察到这种分层处理的一致性。这说明情感信息在物体识别系统中是分层处理的,且这种分层模式在不同刺激下都较为稳定。
- 情感信息在物体类别内的表征相似性更高:研究人员通过 k-means 聚类和计算表征相似性发现,物体类别内情感信息的表征相似性大于类别间,且 AlexNet 的 fc8 层在这方面的差异比 conv1 层更明显,这意味着 fc8 层编码了更多情感信息。这表明相关物体类别共享常见的情感特征,物体类别在编码情感信息方面有重要作用。
- 物体选择性皮层的活动模式预测情感评分:研究人员分析 BOLD5000 数据集的 fMRI 数据,以 Heschl’s gyrus 为对照区域,对比 EarlyVis、LOC、OPA、PPA 和 RSC 等视觉区域预测情感评分的能力。结果显示,所有视觉区域都比 Heschl’s gyrus 表现更好,且 LOC 区域在预测情感评分上优于其他视觉区域。这说明情感评分主要由 LOC 区域编码的物体表征驱动,情感识别主要依赖视觉物体识别系统。
综合研究结果和讨论部分,这项研究意义非凡。它表明日常生活场景引发的情感主要由物体识别介导,只有当物体内容无法提供足够信息时,才需要额外的视觉处理机制。这一发现支持了物体分类是对视觉场景产生情感反应的必要条件这一理论,与之前一些研究中物体识别先于情感产生、且两者潜伏期正相关的结论相呼应 。不过,研究也存在一定局限性,比如 fMRI 任务和情感分类任务存在差异,可能影响神经处理的可比性,而且目前的结果不能明确物体分类和情感之间的因果关系。但总体而言,该研究为理解人类情感处理机制提供了新的视角,为后续研究指明了方向,相信未来结合 EEG/MEG 等技术的研究能进一步揭示其中的奥秘。