综述:顽固性目标的适应性价值

《TRENDS IN Cognitive Sciences》:The adaptive value of stubborn goals

【字体: 时间:2025年10月30日 来源:TRENDS IN Cognitive Sciences 17.2

编辑推荐:

  这篇来自《Trends in Cognitive Sciences》的精彩综述挑战了传统观点,认为人类对目标的“顽固”承诺并非简单的非理性偏差,而是源于多种适应性机制。文章巧妙地从计算、算法层面剖析了目标稳定性如何优化认知资源分配、屏蔽决策干扰,并为缺乏即时外部奖励的复杂行为提供动机“脚手架”(Scaffolding)。作者进一步探讨了支持目标选择、执行与修订的算法架构(如Rubicon模型、分层强化学习HRL),并深刻揭示了这些机制失调如何与精神健康维度(如ADHD、冷漠Apathy)相关联,为理解目标承诺的神经基础提供了全新框架。

  

承诺于目标

人类表现出一种显著的趋势:执着于已选定的目标。这种对目标的强烈依恋常常显得非理性——诸如“执着”或“沉没成本偏差”等术语正是捕捉了这一视角。然而,这种看似不灵活的目标承诺可能源于多种适应性机制。当考虑到个体需要在资源有限、决策具有长期后果的复杂环境中行动时,目标持久性可以成为一种良好的通用策略。

定义目标与目标稳定性

在此,我们将目标定义为指导持续性行为的、对期望的未来结果的心理表征。这与实现目标的具体行动或目标的效用是不同的。目标一旦被选定,便展现出显著的稳定性。这意味着,仅仅因为某个行动与选定的目标一致,其被选择的可能性就会增加。实证研究表明,这种稳定性在实验室范式中常表现为相对于最大化研究奖励或强化学习视角下的估计奖励而言的次优偏差。那么,问题随之产生:为何我们会观察到如此强烈、看似不适应的目标承诺?

计算层面:目标稳定性的三个理性原因

在单一任务背景下看似非理性的目标承诺,若对照更广泛的成本函数进行评估,则可能是理性的。本节探讨三种性质不同的环境约束,它们共同促成了稳定的目标。
资源理性
在许多情况下,目标稳定性可能反映了对有限认知资源的有效利用。这源于资源理性的视角:人类常常面临最大化奖励与降低认知成本之间的权衡。围绕目标构建决策过程可以优化认知资源分配,同时导致行为显得僵化或过度持久。例如,早期目标选择可以通过形成高效的“任务理解”、避免在不同心理表征间切换的成本、以及采用先选择目标再规划实施的序列阶段来节省认知资源。在需要社会协调的情境中,放弃目标会带来个体和集体成本,这使得稳定目标至关重要。
屏蔽干扰
除了节省认知资源,目标承诺可能源于另一种性质不同的适应性功能:保护决策免受不必要的干扰。考虑自己做饭而非购买外卖的决定。尽管事先觉得决定很明确,但当傍晚经过外卖店时,偏好可能发生短暂逆转(即双曲线贴现)。设定目标(如做千层面)的机制可以通过转移目标导向的注意力或增强对已选目标的评价,来减少短暂动机波动的影响。哲学家将这种设定先前意图有益的观点称为理性不再考虑——防止我们在决策能力受损时重新审视决定。
搭建动机脚手架
前文强调目标选择通过约束选项空间使个体受益。然而,目标也能在激励行动方面发挥生成性作用,扩展选项空间。人类能够被高度特异的的目标所吸引,即使是那些没有明显效用的目标(例如儿童玩耍时的自我设定目标)。这些自我选择的目标似乎能产生自身的奖励信号,使朝向目标状态前进的过程变得内在满足,而放弃则变得令人厌恶。在这种情况下,我们会观察到稳定的目标,这是由于目标一致选项获得了额外的“奖励加成”,而非对非目标选项的过滤。这种通过自我强加目标来搭建动机的功能在成年期并未消失,反而在行为与价值之间的联系需要额外支持的情境下(如追求抽象价值)显得尤为关键。

算法层面:实现目标稳定性

哪些算法能在支持灵活行为的同时,带来与目标稳定性相关的各种益处?本节考察几种算法架构。
分离目标选择与执行的算法
目标稳定性的一个极端案例出现在“卢比孔模型”家族中。这些模型的核心前提是,实时决策在离散阶段中顺序展开:先是评估可能目标的阶段(“目标设定”),随后是执行选定目标的阶段(“目标实施”)。重要的是,在这些模型中,一旦目标被选定,对替代目标的深思便停止,资源被分配至其实施。这种决策阶段的分离显然会在行为上表现为强大的目标稳定性。其逻辑与分层强化学习(HRL)的原则相呼应,但离散阶段可能对应多种不同的算法实现。有证据表明,人们以符合资源理性策略的方式,对目标选择和实施使用不同类型的算法。例如,个体可能使用模型自由策略进行目标选择,同时使用模型基础策略来实现选定的目标。
支持灵活性的算法
哪些算法能在继续赋予稳定目标所带来的好处的同时,实现放弃失败目标所需的灵活性?一类平衡这些需求的算法涉及监控当前默认选项是否达到重新评估的阈值。例如,这可能包括将当前目标的成功程度与长期平均值或预期进展速率进行比较,而非持续监控所有替代选项。这种算法及其神经实施的特征见于许多生态决策情境中(如觅食行为)。关键的是,对当前目标价值的持续监控(无论如何形式化)与抑制目标无关信息(防止被替代目标分散注意力)是一致的。这与实证发现相符:目标放弃更多地由当前目标贬值驱动,而非替代目标价值的同等增加。

目标稳定性与精神健康

我们所采用的计算视角为理解支撑目标选择、追求和修订的不同算法提供了一个有用的框架。这些机制的失调可能导致不同形式的对目标过度承诺或承诺不足。未来研究的一个激动人心的方向是检验这些不同机制的校准如何映射到精神健康的跨诊断维度上。
目标设定通过约束所考虑的选项空间来发挥作用——既保护目标免受干扰,又允许资源向其分配实施。这需要将注意力导向目标一致信息同时抑制无关信息的机制。注意力过滤的校准必须与任务需求匹配:过滤过少使个体易受干扰,而过滤过度可能阻挡潜在的重要信号。这些过滤机制的校准差异可能构成精神健康中目标承诺减弱的特定形式的基础。例如,注意力缺陷多动障碍(ADHD)的症状涉及与自上而下注意力变化相关的 distractibility 增加,表明从目标无关信息中屏蔽注意力的能力普遍降低。
我们也强调了对支持监控和修订进行中目标的算法的需求。近期一项研究将特质性冷漠(Apathy)与监控和修订当前行为的失败联系起来。尽管冷漠是一种与普遍动机丧失相关的跨诊断症状,但它可能并非总是表现为行动失败,而是表现为发起改变进行中行为的失败。这些发现表明,至少部分冷漠指标与监控进行中目标的过程有关,而非纯粹的动机缺陷。
最后,调节促进目标追求和阻止放弃的动机信号对于维持心理健康至关重要。目标追求与丰富的情绪分类相关,包括目标受挫时的沮丧或失望,以及目标达成时的兴高采烈。由于未能朝着目标进展是令人厌恶的,人们长期关注“目标脱离”的适应性价值——即当目标变得无法实现时,个体必须能够从这组动机信号系统中脱离出来以保护其健康。然而,在有抑郁风险的个体中,目标脱离反而与更高的抑郁症状相关,这可能是因为抑郁症状本身促进了过度脱离目标。这些发现凸显了我们调节激励追求选定目标的信号的能力的重要性及其与精神健康的相关性。

结论

人类拥有被自我选定的目标所吸引的非凡能力。这常常表现为强烈不愿放弃目标——即使面临高成本或更好的替代方案。我们建议,这并非一种不适应的偏差,而是反映了一组解决关键计算挑战的适应性机制。稳定的目标可能源于认知资源的优化、对长期目标免受干扰的保护,以及在缺乏基本奖励信号的情况下为复杂行为搭建脚手架。考虑这些适应性功能对于开发捕捉目标在决策中核心作用的算法模型至关重要。进而,描述这些过程可能被错误校准的不同方式,将为理解影响精神健康的目标承诺紊乱提供关键见解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号