编辑推荐:
以纹状体为目标的运动感应神经元通过支持日常活动来影响小鼠的动作选择。
对小鼠的研究表明,以纹状体尾部为靶点的多巴胺能神经元编目反复出现的行为以简化决策学习.
研究表明,当小鼠学会将特定动作与听觉线索联系起来时,细胞会对运动做出反应,并释放多巴胺,比如在尖叫声后右转或在低沉的音符后左转。研究结果表明,纹状体尾部的损伤阻碍了动物的学习。
最初,动物会根据哪种选择产生最有回报的结果进行选择。但该研究的共同负责人表示,随着时间的推移,大脑会根据之前的行为做出决定,而不管结果后来是否发生变化。桑斯伯里威康神经电路和行为中心组长Marcus Stephenson-Jones补充道,这种基于非价值的方法自动化了决策,并为其他任务释放了认知资源。他的这篇文章于上个月发表于Nature,可以解释为什么习惯很难打破,即使它们不再令人愉快。
没有参与这项研究的加州大学河滨分校心理学助理教授Ian Ballard说:“这解释了我们长期以来在心理研究中看到的大量数据,即人们倾向于重复过去的行为,而不管结果如何。”
根据20世纪90年代末的研究,中脑中的多巴胺神经元发出信号,表示动物做出决定时可能产生的结果的价值。多巴胺能活动被称为奖励预测误差(RPE),它反映了结果是好是坏。但经典的RPE理论并不总是反映实验结果:多巴胺能神经元对多种刺激作出反应,从简单刺激运动感知到的威胁。
一个由计算模型-表明运动相关的多巴胺神经元可以加强无价值方式第二种途径称为动作预测误差(APE),它表示执行的动作与其预测发生的动作之间的差异。APE会在动作再次发生时更新,从而使行为更有可能发生。
根据这个理论,当动物学会预测他们将要采取的行动时,APE信号的大小会减弱。事实上,新的研究发现,当小鼠正确地将运动方向与声音联系起来时,设计成表达荧光多巴胺受体的小鼠体内多巴胺的释放减少。当研究人员通过给动物更多的水来调整奖励的大小时,纹状体尾部的多巴胺信号保持不变。
“这项研究支持[计算]模型的关键预测,”没有参与新研究但开发了该模型的牛津大学计算神经科学教授Rafal Bogacz说,他第一次听说研究结果的那天“是我科学生涯中最令人满意的一天,它解释了我们长期以来在心理研究中看到的大量数据,即人们往往会重复过去的行为,而不管结果如何。”
没有参与这项工作的普林斯顿大学计算和理论神经科学教授Nathaniel Daw说:“但预测误差的关键特征在这项新研究中仍未得到探索,例如,学会将果汁奖励与闪光联系在一起的猴子对提示和奖励都会显示出强烈的RPE信号。根据1997年的一项开创性研究,当他们暴露在没有果汁的光提示下时,多巴胺信号被抑制研究。当预测的行动被阻止时,显示同样的负面信号将使新的工作更具结论性。
然而Stephenson-Jones说,当运动受到抑制时,APE信号是否会消失尚不清楚。“积极抑制反应往往伴随着肌肉收缩,因此即使这样也可能会引发积极的APE。即使我们能够展示这一点,我认为这也可能是一种完全人为的情况,可能永远不会发生,或至少很少发生。”
到目前为止,还不清楚威胁在双重学习模式中的位置。对威胁作出反应的多巴胺神经元也以纹状体尾部为目标学习建议此活动编码威胁预测错误(TPE)。
Stephenson-Jones说,他和他的同事计划研究TPE和APE如何在同一脑回路中协同工作。未来的实验还可能揭示靶向纹状体其他部位(如背外侧区)的运动相关多巴胺神经元是否也编码APE。如果是这样,双重模式可能适用于更复杂的行为,例如学习乐器。