编辑推荐:
这篇研究聚焦决策过程,发现决策一致的置信偏差(DCB)普遍存在于感知和价值决策任务中。通过行为、神经和计算多方面证据,揭示互抑制和紧急信号是产生 DCB 的关键,为理解决策的神经计算机制及决策与置信的内在联系提供重要依据。
研究背景
决策是动物和人类行为中选择最优选项的认知过程,已有多种规范模型试图描述这一过程,如经典信号检测理论(SDT)、序列采样模型(SSMs)和神经网络吸引子模型(NNAM)等。SDT 能对选择行为进行统计描述,但缺乏决策动态细节;SSMs 通过扩展 SDT,能描述决策的行为和神经动态;NNAM 则基于神经元群体相互抑制的原理,也可复制决策的相关动态。同时,决策常伴随着不确定性,决策者可对其进行评估并给出选择的置信度,上述两种模型都可扩展以解释置信度,但目前缺乏区分这些模型的实证和理论证据。此外,近期研究发现决策与置信之间存在系统偏差,多种模型尝试解释这一现象,但大多认为置信与决策是分离的,这引发了关于两者过程是否相同的疑问。
实验方法
- 实验任务:分别进行了感知决策实验(n=28)和价值决策实验(n=27)。在每个实验的每次试验中,同时呈现两个备选选项,参与者做出选择后立即对选择的置信度进行评分。在感知决策任务中,选项的证据强度由随机点运动图(RDK)中向特定方向移动的点与随机方向移动的点的比例(相干性)表示;在价值决策任务中,证据强度由选项的主观价值表示,主观价值通过奖励概率和奖励大小的最佳模型计算得出。
- 数据分析方法:使用不同的一般线性模型(GLMs)定量评估两个备选选项对参与者选择、选择正确性或最优性以及置信度的个体贡献。将证据强度转换为证据差异(ΔV)和证据总和(ΣV),以分析潜在偏差和敏感性。通过模型比较确定解释不同行为指标的最佳模型,并对全模型进行分析以比较各变量的贡献。同时,在全脑范围内搜索与选择和置信度相关的神经活动,使用 GLM 分析神经活动与置信度评分的关系,并评估神经活动是否存在 DCB 效应。此外,构建一系列神经计算模型,通过蒙特卡罗计算拟合模型参数,比较不同模型对数据的解释能力,分析模型产生 DCB 效应的条件。
实验结果
- 行为结果:通过 GLM 分析发现,在置信度模型中,存在显著的偏向所选选项的偏差(DCB),但在选择模型和选择正确性 / 最优性模型中未发现此偏差。将证据强度转换为ΔV和ΣV后,模型比较结果显示,解释选择和选择正确性 / 最优性的最佳模型仅包含ΔV,而解释置信度的最佳模型包含ΔV、ΣV和反应时间(RT)。全模型分析进一步证实了 DCB 的存在,且该偏差与选择正确性 / 最优性无关,个体在置信度和选择及选择正确性 / 最优性中的ΣV系数无显著相关性,但选择和置信度过程存在共同噪声,且置信度判断可能涉及额外过程。在价值决策任务中,DCB 在需要深思熟虑的 “脑内权衡”(brainer)试验中显著存在,而在 “无需思考”(no - brainer)试验中不存在。
- 神经结果:在全脑搜索中发现,运动相关脑区的活动可解码参与者的选择,而背侧前扣带回皮层(dACC)、腹侧纹状体(VS)、前辅助运动区(pre - SMA)和腹内侧前额叶皮层(vmPFC)的活动可解码置信度。这些置信编码脑区可预测选择的正确性或最优性,但不能预测选择的侧向化。进一步分析发现,除 vmPFC 外,这些脑区的神经活动受ΔV和ΣV的显著调制,且β值的符号一致表明存在 DCB 效应。dACC 的神经 DCB 效应与行为 DCB 效应高度相关,且在价值任务中,dACC 的神经 DCB 效应仅在 brainer 试验中出现。vmPFC 在价值比较中起重要作用,其活动与证据差异相关,且在不同类型试验中的活动模式与置信度模式一致,表明 dACC 和 vmPFC 可能本质上都编码置信度。此外,fMRI 分析显示,与ΣV相关的神经活动在全脑并不突出,仅在部分脑区存在,且这些脑区编码置信度,其同时与ΔV和ΣV相关可能反映了对置信度的敏感性。
- 神经计算模型结果:构建的神经计算模型包含两个关键特征:备选选项的两个累加器是否相互抑制(参数λ)以及有效决策边界是否受紧急信号动态影响。通过模型拟合和比较,发现同时具有互抑制和紧急信号的模型(模型 4)能最好地解释参与者的行为数据,该模型不仅能复制选择、置信度评分和反应时间,还能产生选择性 DCB 效应,而去除这两个组件中的任何一个都会导致无法产生 DCB 效应。此外,引入额外参数以考虑决策后置信形成中对未选选项证据折扣的模型,经拟合后最佳模型仍为模型 4,且这些模型中对两个竞争证据的权重分配并不偏向所选选项,表明决策后偏差效应既不是复制 DCB 的充分条件也不是必要条件。通过对不同参数维度的模拟分析,进一步证实 DCB 是特定决策模型结构的决定因素,与参数具体值无关。
- 神经计算特征导致 DCB 的分析:对获胜模型(模型 4)的决策动态分析表明,该模型主要驱动决策状态形成占主导的赢者通吃(WTA)状态,在这种状态下,被否决选项的积累证据在决策早期就被完全抑制到基线,而支持选项的证据向边界移动。DCB 仅在出现主导 WTA 状态的试验中观察到,且在这些试验中,平均置信度与平均ΣV的关系也呈现 DCB 趋势。此外,在一定ΔV水平下,较低的ΣV会使决策状态更快地演变为主导 WTA 状态,导致证据差异在早期增加较慢,最终决策状态的证据差异(即置信度)大多位于衰减边界附近,从而使得ΣV越高,置信度越高,这与实证研究中观察到的 DCB 一致。同时,反应时间与紧急信号和 DCB 效应密切相关,通过模拟固定刺激呈现时间的任务发现,随着紧急信号增加更陡峭,ΣV对反应时间的影响变小,而对模型置信度的影响几乎不变。
研究结论
本研究通过行为、神经和计算多方面的证据,系统地研究了决策一致的置信偏差(DCB)在感知和价值决策任务中的表现。发现互抑制和紧急信号是决策神经计算模型中不可或缺的组件,它们导致决策早期形成主导的 WTA 状态,进而引发 DCB。这一研究结果为理解决策的神经计算机制提供了新的视角,揭示了决策与置信之间的内在联系,有助于进一步深入研究决策过程的神经基础。