
-
生物通官微
陪你抓住生命科技
跳动的脉搏
灵长类壳核中价值与模态编码的高效动态神经几何及其对价值引导行为的作用
【字体: 大 中 小 】 时间:2025年09月18日 来源:Nature Communications 15.7
编辑推荐:
本研究针对基底神经节如何利用有限资源高效处理多模态奖赏价值信息这一核心问题,揭示了猕猴壳核中双模态价值神经元通过共享抽象表征,在低维空间中动态编码价值与模态信息,并发现其几何结构的快速转化与适应性行为及学习状态密切相关,为理解价值引导行为的神经机制提供了重要见解。
大脑如何在有限的神经资源下高效处理多种信息,是神经科学领域的核心问题。与可无限扩展计算资源的现代人工智能不同,生物大脑的神经资源极为有限,尤其在皮质-基底神经节环路中,神经元数量呈现显著的"解剖漏斗"式减少。这种结构特征表明,纹状体神经元可能以汇聚方式处理多个皮质输入。先前研究已发现,灵长类壳核中存在能够同时编码触觉和视觉价值信息的双模态价值神经元,这些神经元占壳核价值编码神经元的半数以上,体现了纹状体以少量神经元高效处理多种功能的量化效率。
然而,仅追求量化效率并不能保证信息质量。如果双模态价值神经元将触觉和视觉价值信息编码为统一的价值表征而不保留模态特征,可能导致信息质量下降。这在动物需要同时依赖模态和价值信息的条件下尤为关键,且这些信息可能在未来的学习和决策场景中发挥重要作用。因此,完整保留信息对于在各种环境中优化价值引导行为可能具有重要益处。基于此,研究人员提出假设:壳核神经元可能采用某种机制,在保证量化效率的同时,也能定性保存信息。
高效的信息处理可能涉及基于共享特征对多条信息进行泛化。考虑到神经元能量消耗,生成更多神经模式需要更多能量,因为大脑状态之间的转换涉及突触变化、离子通道改变和结构修饰,所有这些都需要ATP供应。利用这些共享特征的结构化神经表征,使脑区能够在低维神经表征中更简洁、高效地处理多样化信息。这种抽象形式的神经几何已在 prefrontal cortex(前额叶皮层)和 hippocampus(海马体)中被观察到,反映了受试者的认知状态。然而,这种抽象表征是否存在于基底神经节系统的灵长类壳核中,仍不清楚。
传统上,壳核因其接收 primary motor cortex(初级运动皮层,MI)的输入并向 globus pallidus internal segment(内侧苍白球)输出(后者又投射回MI)而被认为在运动控制中发挥重要作用。然而,壳核神经元也接收来自感觉区域的输入,包括用于触觉处理的 somatosensory cortex(体感皮层)和用于视觉处理的 temporal cortex(颞叶皮层),以及来自 substantia nigra pars compacta(黑质致密部)的多巴胺能输入。反映这些解剖连接,研究报道了壳核的各种功能,包括动作价值处理、物体价值处理和学习。这些发现表明,壳核的作用超出了运动控制,延伸至价值学习和行为适应等认知过程,可能通过感觉-价值转换实现。
鉴于其处理运动、感觉和价值相关信号,基本问题仍然存在:壳核如何在群体水平编码两种不同类型的信息(价值模态)?壳核的群体活动是否通过共享表征产生高效的神经几何?如果是,这种几何结构如何在不同学习阶段动态转换?此外,其神经表征的哪些方面最能反映并指导适应性价值引导运动背后的认知状态?
为了回答这些问题,研究人员训练猕猴执行触觉和视觉价值逆转任务(T-VRT和V-VRT)。在这些任务中,一种盲文模式或分形图像与奖赏(好)相关联,另一种则没有(坏)。这种刺激-奖赏 contingency( contingency)在40次试验后逆转,使得研究人员能够在排除对刺激的神经反应的同时,检查编码价值的神经反应。
研究人员通过单单位记录,在灵长类壳核中识别出三种类型的价值编码神经元:触觉选择性价值神经元、视觉选择性价值神经元和双模态价值神经元。双模态价值神经元占所有任务相关响应神经元的43%(129/299)和所有价值编码神经元的52%(129/247)。值得注意的是,壳核中的双模态价值神经元在T-VRT和V-VRT中都显示出价值辨别反应,但这些反应在同一时期往往不同,且常常发生在完全不同的时期。
为了确定双模态价值神经元是在群体水平上分别处理每种价值还是以统一方式处理,研究人员使用三个变量(模态、价值及其交互作用)对双模态价值神经元进行了群体解码分析。解码结果显示,价值信息在刺激呈现前处于 chance level(机会水平),但随着刺激呈现迅速开始增加。相比之下,模态在刺激呈现前就以近100%的准确率被解码,表明双模态价值神经元处理模态信息的方式类似于在每个任务中处理上下文信息。价值和模态交互作用的解码准确率也在刺激呈现后增加并达到近100%,但在刺激呈现前就已达到约50%(机会水平=25%)。混淆矩阵结果表明,解码器在刺激呈现前区分触觉和视觉模态,并在刺激呈现后开始区分每个模态条件下的特定价值。这表明双模态价值神经元将模态作为上下文信息处理,并在每个模态条件下选择性地区分价值。
这些神经表征随时间动态变化。研究人员比较了投射到前三个 principal components(主成分,PCs)的子空间中四种条件(模态和价值的组合)的群体活动动力学。与解码结果一致,轨迹显示潜在空间中的动力学模式最初按模态聚类,然后在刺激呈现后根据其价值和模态分化。值得注意的是,好价值的轨迹几乎沿着相同方向平行移动,而坏价值的轨迹也平行但向相反方向移动,表明了一种价值的抽象表征。
研究人员进一步使用 cross-condition generalization performance(交叉条件泛化性能,CCGP)测量了每个变量在共享特征上的泛化程度。CCGP分析揭示了价值和模态泛化程度的动态变化。试验开始时,模态的CCGP高于机会水平并持续到刺激呈现后-150毫秒。相比之下,价值的CCGP在刺激出现后增加,在刺激出现后230毫秒超过机会水平。价值的CCGP在刺激出现后和延迟期持续上升,而模态的CCGP在刺激出现时和延迟期开始时持续下降。
为了清晰验证和可视化这一观察,研究人员将试验时间窗口划分为三个不同的阶段:阶段1(刺激前-早期刺激期,从刺激开始前200毫秒到刺激开始后150毫秒)、阶段2(刺激呈现期,150-500毫秒)和阶段3(空白延迟期,500-1000毫秒)。分析显示,在阶段1,模态的CCGP高于机会水平,而价值的CCGP则不然。在阶段2和阶段3,价值和模态交互作用的解码准确率超过98%,但泛化表征的程度随着阶段的进展而动态变化。在阶段2,价值和模态的CCGP均高于机会水平。然而,在阶段3,价值泛化表征的程度进一步增加,但模态泛化表征的程度降至机会水平。
研究人员还计算了 parallelism score(并行度得分,PS)以量化编码方向的平行程度。结果显示,除阶段1的价值PS外,所有阶段的价值和模态PS均高于机会水平,表明刺激出现后两种变量的编码方向几乎平行,可能导致阶段2和阶段3的高解码准确率和CCGP。
为了可视化这些神经表征的几何结构,研究人员将每个阶段所有可能的价值和模态配对的平均群体活动投射到三维主成分(PC)空间。在阶段1,群体活动根据模态聚类,显示相同模态的相似表征结果。进入阶段2后,每个变量发生分化,形成捕获价值和模态低维表征的方形几何结构。随后,这种几何排列在阶段3的延迟期沿价值轴拉伸,形成矩形几何结构,反映相同价值表征的相似性比相同模态更强。
研究人员进一步探讨了这种表征几何是否与价值引导行为的性能相关。根据手指插入反应时间将试验分为适应性行为试验和非适应性行为试验后分析发现,传统群体解码分析显示两组在所有阶段没有明显差异,特别是在阶段2和阶段3,解码准确率接近100%。然而,这两组在价值和模态的泛化表征动态变化上显示出清晰差异。在适应性行为试验中,阶段2的模态CCGP降至机会水平,而价值CCGP在阶段2增加并超过机会水平,在阶段3达到近100%的准确率。相反,在非适应性行为试验中,模态CCGP在所有阶段均高于机会水平,而价值CCGP在阶段2处于机会水平,仅在阶段3略微超过机会水平。潜在空间投影显示,适应性行为试验的神经几何随着阶段的进展比非适应性行为试验更极端地沿价值轴拉伸。
鉴于先前研究发现壳核在物体价值联想学习中发挥作用,研究人员检查了壳核中神经几何的转换在T-VRT和V-VRT的学习阶段是否不同。随着物体价值联想学习的进展,猴子的反应时间在不同学习阶段发生变化。在早期学习阶段(每个区块的前半部分试验),好和坏刺激之间的手指插入反应时间差异比晚期学习阶段(每个区块的后半部分试验)小。神经几何分析显示,在早期学习阶段,价值的CCGP在所有阶段均处于机会水平;然而,在晚期学习阶段,从阶段2开始其CCGP超过机会水平。这表明随着价值学习的进展,神经群体转向更抽象的价值表征。
研究人员还发现两种类型的双模态价值神经元(根据其最强价值反应时期分类:刺激价值神经元和延迟价值神经元)对价值和模态泛化表征的贡献不同。传统神经解码中,价值和模态交互作用的解码准确率在任何阶段都 robustly similar(稳健相似)。然而,CCGP分析揭示了这两种双模态价值神经元在价值和模态泛化表征动态变化上的差异。
对于模态选择性价值神经元(选择性地编码触觉或视觉价值),研究发现其群体活动在所有阶段选择性地表征模态的泛化形式,而不是价值。在传统神经解码中,这些神经元在阶段2和阶段3成功区分价值、模态及其交互作用。然而,其模态的CCGP始终高于机会水平,而价值的CCGP在所有阶段均不显著。神经表征变化的三维潜在空间投影显示,按模态的聚类在所有阶段都得以保留。
该研究主要应用了单单位电生理记录技术、行为学任务范式(触觉和视觉价值逆转任务)、群体解码分析(使用线性支持向量机SVM)、交叉条件泛化性能(CCGP)分析、并行度得分(PS)计算、主成分分析(PCA)降维、置换检验和几何随机模型验证,以及基于反应时间和学习阶段的试验分类分析。实验样本来自两只执行任务的猕猴(Macaca mulatta)的壳核神经元记录数据。
结果
灵长类壳核中触觉和视觉价值的汇聚处理
研究人员训练猴子执行触觉和视觉价值逆转任务(T-VRT和V-VRT)。猴子在两次呈现相同触觉或视觉刺激后,更快地将手指插入孔中当先前经历过的好刺激呈现时。反应时间差异表明猴子获得并保留了与触觉和视觉刺激相关的价值直到第二次提示呈现。通过单单位记录,在灵长类壳核中识别出三种价值编码神经元:触觉选择性价值神经元、视觉选择性价值神经元和双模态价值神经元。双模态价值神经元显示出在T-VRT和V-VRT中的价值辨别反应,但这些反应在同一时期往往不同。
双模态价值神经元的神经群体表征触觉和视觉价值
群体解码分析显示,价值信息在刺激呈现前处于机会水平,但随着刺激呈现迅速增加。模态在刺激呈现前就以近100%的准确率被解码。价值和模态交互作用的解码准确率也在刺激呈现后增加。混淆矩阵表明解码器在刺激呈现前区分模态,并在刺激呈现后区分每个模态条件下的价值。群体活动动力学显示,潜在空间中的轨迹最初按模态聚类,然后在刺激呈现后根据价值和模态分化,好价值和坏价值的轨迹平行但方向相反,表明了一种抽象价值表征。
价值和模态处理过程中神经几何的动态变化
CCGP分析揭示了价值和模态泛化程度的动态变化。试验开始时模态的CCGP高于机会水平,而价值的CCGP在刺激出现后增加。将试验分为三个阶段后分析显示,在阶段1,模态的CCGP高于机会水平而价值的CCGP不然;在阶段2,两者CCGP均高于机会水平;在阶段3,价值CCGP增加而模态CCGP降至机会水平。PS计算表明除阶段1的价值外,所有阶段的价值和模态PS均高于机会水平。三维PC空间投影显示,群体活动在阶段1按模态聚类,阶段2形成方形几何结构,阶段3拉伸为矩形几何结构,沿价值轴显示出更强相似性。
价值与模态的表征几何与价值引导行为的性能相关
根据反应时间将试验分为适应性行为和非适应性行为试验后,传统解码显示两组无差异,但CCGP分析揭示明显不同。在适应性试验中,阶段2模态CCGP降至机会水平而价值CCGP增加;在非适应性试验中,模态CCGP始终高于机会水平而价值CCGP仅略微超过机会水平。三维投影显示适应性试验的神经几何更极端地沿价值轴拉伸。
神经几何动力学反映与不同学习阶段相关的认知状态
随着学习进展,猴子反应时间发生变化。在早期学习阶段,价值和模态的CCGP与传统解码无差异;在晚期学习阶段,价值CCGP从阶段2起超过机会水平。三维投影显示早期学习阶段相同模态表征更聚类,而晚期学习阶段相同价值表征更聚类。
两种双模态价值神经元对价值与模态泛化表征的不同贡献
刺激价值神经元和延迟价值神经元的传统解码性能相似,但CCGP分析显示其动态变化不同。刺激价值神经元在阶段2和阶段3表现出价值和模态的高CCGP,而延迟价值神经元仅在阶段3表现出价值的高CCGP。
模态选择性价值神经元对模态而非价值的选择性泛化表征
模态选择性价值神经元的群体活动选择性地表征模态的泛化形式而非价值。其模态CCGP始终高于机会水平而价值CCGP不显著。三维投影显示按模态的聚类在所有阶段得以保留。其动态变化与行为性能和学习阶段无关。
讨论
该研究揭示了灵长类壳核中双模态价值神经元通过共享抽象表征,在低维空间中高效编码价值与模态信息。其神经几何结构随着试验进程向价值引导运动动态转换,在单个试验内从模态聚类转变为价值抽象。这种几何结构的更快转化与反映良好适应和良好学习的价值引导行为的认知状态相关。相比之下,这种关系在单模态价值神经元中显著缺失,表明双模态价值神经元在编码价值引导行为背后的认知状态中具有独特作用。
壳核神经元使用低维表征处理价值和模态信息,这一特征主要在高级结构(如前额叶皮层和海马体)中有报道。考虑到从壳核到后续结构的神经元数量逐渐减少,在这种解剖漏斗结构中,通过共享表征减少神经群体模式可能使这些下游区域能够用更少的神经元高效处理多样化信息。此外,考虑到神经元水平的能量消耗,基于共享特征的处理可能通过减少状态转换所需的能量获得潜在效率收益。
神经几何向价值抽象的转换反映了价值引导行为的适应状态和学习阶段。随着物体价值逆转学习的进展,神经几何转换加速,在晚期学习阶段比早期阶段更快转向共享价值表征。这种转变表明壳核神经元可能参与感觉-价值转换处理以指导目标导向行为。在该研究的任务中,一旦价值被识别,模态信息可能变得无关紧要。因此,价值抽象的程度可能与行为性能更直接相关,更高的抽象有助于更有效的动作选择和执行以实现目标。
价值引导行为的性能与神经几何的变化模式相关性比与传统解码方法的预测更强。这是因为在阶段2和阶段3,跨学习阶段和适应状态的价值和模态解码准确率持续超过90%。这些发现表明,神经几何向共享价值表征的转换在捕获壳核神经元编码价值引导运动的泛化奖赏预期的认知状态时更为敏感。
该研究强调了双模态价值神经元在平衡效率和信息保真度方面的关键作用,其动态变化促进了价值引导行为所需的认知状态。这些发现为理解基底神经节如何利用有限资源高效处理多模态信息提供了新的见解,对理解正常和异常价值导向决策的神经机制具有重要意义。论文发表在《Nature Communications》期刊。
生物通微信公众号
知名企业招聘