
-
生物通官微
陪你抓住生命科技
跳动的脉搏
延迟奖励削弱人类目标导向行为的因果关联:时间连续性对行为调控的机制研究
【字体: 大 中 小 】 时间:2025年06月08日 来源:npj Science of Learning 3.6
编辑推荐:
本研究探讨了延迟奖励如何削弱人类目标导向行为中的因果关联。研究人员通过三项实验(N=290)模拟股票投资任务,比较即时反馈与5秒延迟反馈条件下参与者对结果重估(outcome revaluation)的敏感性。结果发现延迟反馈显著降低行为反应率,减弱行动-结果(action-outcome)关联强度,并削弱参与者对因果关系的认知。该研究为Perez-Dickinson理论框架提供实证支持,揭示时间连续性在维持目标导向控制(goal-directed control)中的核心作用,对理解金融决策、习惯形成等现实场景具有重要启示。
在现实世界中,从退休储蓄到健康管理,许多重要决策的后果往往延迟显现。这种时间差如何影响我们坚持长期目标的能力?传统行为经济学强调时间折扣(temporal discounting)的作用,认为人们单纯因为未来奖励的主观价值降低而做出短视选择。但最新理论提出,延迟可能从根本上破坏我们感知行动与结果之间因果联系的能力——这种机制在实验室的啮齿动物研究中已见端倪,却在人类认知领域缺乏直接证据。
来自智利复杂工程系统研究所(ISCI)的Omar David Perez与英国诺丁汉大学的Gonzal o P. Urcelay在《npj Science of Learning》发表的研究,通过精巧的行为实验揭示了这一机制。研究者设计了三项系列实验,让参与者扮演股票经纪人,在模拟的"巴黎"和"伦敦"市场(分别对应即时和5秒延迟反馈条件)投资两家虚构公司股票。训练阶段后,突然告知参与者一家公司股价暴跌(结果重估值),随后在无反馈的测试阶段观察投资行为变化。
研究采用计算机化行为任务结合混合效应模型分析,通过对比即时与延迟反馈条件下的反应率、重估敏感性和事后因果知识问卷,系统评估延迟强化的影响。样本包括实验室和在线平台招募的290名参与者,通过功率分析确保统计效力。
延迟反馈降低行为反应率
数据分析显示,延迟条件在所有实验中均显著降低按键反应率(股票购买次数)。如表1所示,即时条件下的平均反应率(经平方根转换后)在实验1为9.43,而延迟条件仅7.32;实验3中该差距虽缩小但仍显著(即时17.25 vs 延迟15.04)。这印证了Dickinson等人在啮齿类中的发现,说明时间延迟普遍削弱行为动机。
重估敏感性的条件依赖性
关键发现体现在测试阶段:当整合三项实验数据时,延迟与重估存在显著交互作用(F(1,289)=5.69, p=0.018)。如图2底部所示,即时条件下参与者明显减少对贬值公司的投资(t(289)=2.91, p=0.004),而延迟条件下该差异消失(t(289)=0.17, p=0.866)。混合模型进一步显示,延迟使重估效应减弱1.767个单位(p=0.002),表明5秒延迟足以破坏基于结果价值的决策调整能力。
因果知识编码受损
在实验2-3的事后测试中,延迟条件下参与者对"哪个按键对应哪家公司"的记忆准确率显著更低(即时1.24 vs 延迟0.96,p=0.002)。值得注意的是,这种认知缺陷与行为反应率无直接关联,共同指向Perez-Dickinson理论的核心假设——延迟通过降低行动-结果速率相关性(rate correlation)而非单纯削弱动机来影响行为控制。
这些发现革新了我们对延迟效应机制的理解。不同于传统RL(强化学习)模型将延迟视为奖励价值的折扣因子,该研究证明延迟会扭曲因果归因本身。当反馈不及时,大脑可能将结果归因于环境背景而非自身行动,这与Urcelay-Jonkman的动物研究形成跨物种印证。在神经层面,这解释了为何vmPFC(腹内侧前额叶皮层)活动与即时条件下的重估敏感性相关——该脑区正是整合行动-结果关联与价值信息的枢纽。
研究对现实场景具有多重启示:在金融领域,投资者可能因收益延迟而低估自身策略的作用;在健康管理中,锻炼效果的不即时性可能削弱行为坚持。研究同时为干预指明方向——通过增强行动-结果的感知关联(如可视化累积效应)可能抵消延迟的负面影响。未来研究可拓展到初级强化物(如食物)领域,并探索不同延迟时长阈值,这将为构建更完备的目标导向行为理论提供关键拼图。
生物通微信公众号
知名企业招聘