编辑推荐:
在人类价值学习中,分心物效应(distractor effect)的方向和时间尺度尚不明晰。研究人员通过开展价值学习实验,让参与者学习并选择不同价值的选项。结果发现,分心物影响基于长期时间尺度,且个体间存在差异。该研究为理解价值学习机制提供了新视角。
在日常生活中,人们常常会面临各种选择,比如购买商品时,商家推出的不同款式、不同价格的产品会影响我们的决策。在心理学和行为经济学领域,这种现象被称为 “分心物效应”(distractor effect),即一个较低价值的选项(分心物)会影响人们对两个较高价值选项的选择偏好。然而,目前关于分心物效应的方向和时间尺度仍存在诸多争议。一方面,不同的实验范式得到的分心物效应方向不一致,有些研究显示为正效应,有些则为负效应,甚至部分结果无法重复或重新分析后方向改变。另一方面,价值表征受之前遇到的选项(时间情境,temporal context)和当前选择试验中即时可用的选项(立即情境,immediate context)的影响,但以往研究未能系统区分这两种情境对价值判断的相对影响。为了解决这些问题,来自德国汉堡大学医学中心神经生理学和病理生理学系、汉堡大学心理学系和汉堡神经科学中心以及英国布里斯托大学心理科学学院的研究人员 Maryam Tohidi-Moghaddam 和 Konstantinos Tsetsos 开展了一项研究,相关成果发表在《Communications Psychology》杂志上。
研究人员采用了一种简单的价值学习任务,该任务曾在灵长类动物实验中诱导出负分心物效应。在实验中,参与者需要学习与三个选项相关的价值,并在学习后进行二元和三元选择,同时在学习和选择阶段之间插入价值估计任务,以直接测量参与者在选择前的主观价值。
在方法上,研究人员进行了两项实验。实验 1 为现场实验,招募了 30 名参与者;实验 2 为在线实验,招募了 68 名参与者。实验任务通过 Psychophysics Toolbox 或 Gorilla Experiment Builder 呈现,参与者需完成 48 个迷你模块(mini-blocks)的价值学习任务,每个模块包含学习、选择和两次价值估计阶段。在学习阶段,参与者观察不同颜色硬币对应的奖励价值;在选择阶段,进行二元和三元选择以获取奖励;在价值估计阶段,参与者报告每个选项的主观价值。研究人员使用了多种数据分析方法,如单样本 t 检验、方差分析(ANOVA)、皮尔逊相关分析等,并运用了 Probit 模型、Divisive normalization 模型、Range normalization 模型和 Rank-based 模型等计算模型来分析和解释数据。
研究结果如下:
- 基本表现:参与者在学习、选择和估计阶段都表现出良好的任务参与度。在学习阶段,能准确学习选项价值;在选择阶段,选择最佳选项的准确率显著高于随机水平,且在实验 1 中二元选择的反应时间显著高于三元选择;在估计阶段,估计值与实际值高度相关。
- 学习后的情境依赖失真:分析估计数据发现,高分心物价值会导致两个高价值选项的估计值显著降低,这与 Divisive normalization 模型的预测部分相符,但该模型无法完全解释两个实验中价值差异的变化。
- 选择阶段无分心物效应:通过分析二元和三元试验中的相对选择份额,发现没有统计学上显著的 “情境” 主效应和 “试验类型” 效应,表明即时情境对选择行为没有影响,二元和三元试验中的分心物效应高度相关。
- 估计和选择中的共同价值表征:价值估计和实际选择高度相关,表明两者可能由共同的价值表征驱动。但选择可能会引入一些系统偏差,影响分心物效应的方向。
- 超越归一化理论的情境依赖:提出的 Rank-based(RB)模型能够更好地解释实验数据,该模型基于决策采样框架,通过随机二元比较构建价值表征,能够同时捕捉正、负分心物效应和高分心物情境下的价值降低现象。
研究结论表明,在价值学习过程中,劣质(分心物)选项的价值会在跨越多个学习和选择试验的长时间尺度上扭曲价值表征。而且,这种扭曲的方向在不同参与者之间存在差异,传统的 Divisive normalization 和 Range normalization 理论无法解释这种差异,而 Rank-based 模型能够很好地捕捉这种变异性。该研究为理解价值学习和多选项决策的机制提供了新的见解,有助于推动相关领域对价值判断和决策过程的深入研究,未来研究可进一步拓展实验设计,考虑更多因素对价值学习和决策的影响。