不确定性条件下眶额皮层而非次级运动皮层对选择与结果神经编码的调控作用

【字体: 时间:2025年10月09日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对眶额皮层(OFC)与次级运动皮层(M2)在不确定性奖励学习中的分工机制展开研究。通过钙成像技术与支持向量机解码,发现M2在所有确定性条件下均能高精度编码选择信息,而OFC在更高不确定性条件下对选择与结果的表征显著增强。化学遗传学抑制实验进一步表明,OFC神经元支持所有不确定性水平的学习过程,而M2仅在最确定条件下发挥作用。该研究揭示了前额叶皮层在适应性学习中的功能异质性,为理解决策神经机制提供了重要依据。

  
在 reward-motivated decision making(奖励驱动的决策)研究领域,眶额皮层(orbitofrontal cortex, OFC)和次级运动皮层(secondary motor cortex, M2)长期以来都被认为在 flexible reward learning(灵活性奖励学习)中发挥重要作用,然而这两个脑区在应对不同环境不确定性时的具体分工机制仍不明确。随着行为灵活性与环境适应性研究的重要性日益凸显,阐明神经回路在动态环境中的编码特性成为神经科学研究的焦点之一。
以往研究多聚焦于训练成熟的实验动物,忽略了学习初期神经表征的动态变化过程。此外,尽管OFC和M2都涉及价值表征与行动选择,但二者在不确定性处理、行为策略调用以及学习机制方面的差异仍缺乏系统性比较。特别是在 reward probability schedules(奖励概率方案)逐渐复杂化的情境中,两个脑区如何协调工作以支持适应性行为,仍是未解之谜。
为回答这些问题,Juan Luis Romero-Sosa等研究人员在《Nature Communications》上发表了题为“Neural coding of choice and outcome are modulated by uncertainty in orbitofrontal but not secondary motor cortex”的研究论文。该工作通过体内钙信号成像、支持向量机(SVM)解码和化学遗传学操控等技术,系统比较了大鼠在 de novo learning(从头学习)过程中OFC与M2神经元的活动模式,揭示了不确定性条件下神经编码与行为策略的耦合机制。
本研究主要依托以下几项关键技术方法:使用GCaMP6f钙指示剂和miniscope进行单神经元成像,采集自由行为大鼠的神经活动数据;利用支持向量机(SVM)构建解码模型评估神经活动对行为选择(Chosen Side)和结果(Trial Outcome)的预测能力;通过化学遗传学技术(hM4Di DREADDs)抑制特定脑区神经元活动以验证其功能必要性;采用广义线性模型(GLM)分析行为策略(如Win-Stay、Lose-Shift)与神经解码精度之间的关系。实验动物包括Long-Evans大鼠,部分来源于转基因品系(GAD-Cre与TH-Cre)。所有实验程序均符合UCLA动物伦理委员会规范。
学习过程中不确定性增加的行为表现
研究人员设计了三组奖励概率方案(Schedule 1–3),不确定性逐级增加(如100:0至70:30)。通过广义线性模型(GLM)分析发现,大鼠选择高奖励概率选项的准确率随试验次数和任务区块推进而提升(βtrialnum = 0.0559, p < 0.001;βblock = 1.6671, p < 0.001),但不同方案间无显著差异。值得注意的是,M2植入组的学习表现弱于OFC组,而OFC植入动物的选择延迟明显更短(βArea = -0.57, p < 0.01)。
基于钙活动的选择解码
SVM解码器在选择发生前即能从神经活动中解码选择方向,解码精度在选择后500毫秒达到峰值。在选择前时间窗内,M2的解码精度总体高于OFC(βArea = -0.231, p = 0.0004),且存在脑区与方案的交互效应(βArea×Schedule = 0.056, p = 0.0475)。事后分析表明,在确定性较高的Schedule 1和2中,M2解码显著优于OFC,而在不确定性最高的Schedule 3中,OFC解码精度提升至与M2相当水平。
结果解码与神经元选择性分析
结果解码精度受奖励确定性约束,M2依然表现更优(βArea = -0.138, p = 0.0248)。单细胞选择性分析显示,M2中选择选择性神经元比例始终高于OFC,但OFC中此类神经元比例随不确定性增加而显著上升(βSchedule = 0.06, p < 0.01),M2则无此变化。类似地,OFC中结果编码和奖励检索选择性神经元比例也随不确定性增加,而M2保持稳定。
行为策略对解码精度的预测作用
Win-Stay(WS)和Lose-Shift(LS)等策略指标能显著预测OFC中对选择和结果的解码精度(WS: β = 0.843, p = 0.0008;LS: β = 1.466, p = 0.024),而Perseveration Index( perseveration指数)则呈负相关。这些策略指标对M2的解码精度无显著预测作用,表明OFC编码更紧密关联于适应性行为策略。
化学遗传学抑制验证功能必要性
抑制OFC神经元会损害所有方案下的学习准确率(βDrug = -0.2831, p < 0.02),并降低Win-Stay策略使用。抑制M2仅影响Schedule 1下的表现(βDrug = -0.2018, p < 0.0001),且主要表现在不确定性递增顺序中。此外,OFC抑制还显著延长选择延迟。
本研究通过多角度实验论证了OFC和M2在不确定性学习中的功能分化:M2提供稳定且高精度的行动选择编码,适用于多种确定性条件;而OFC在不确定性升高时显著增强其对选择、结果及奖励信息的表征,并直接关联于Win-Stay/Lose-Shift等适应性策略的使用。化学遗传学抑制进一步证实,OFC广泛参与不同不确定性条件下的学习过程,而M2主要贡献于高确定性环境下的行为表现。
该研究不仅深化了对前额叶皮层功能异质性的理解,也为研究决策障碍类疾病(如成瘾、强迫症等)的神经机制提供了新视角。此外,研究所采用的单细胞成像与解码方法为揭示神经网络动态编码提供了技术范式,而行为策略与神经活动的结合分析则凸显了跨层次研究在系统神经科学中的重要性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号