
-
生物通官微
陪你抓住生命科技
跳动的脉搏
纹状体在策略选择中的仲裁作用指导少样本适应:基于支持-保持与冲突-转移偏见的计算神经机制研究
【字体: 大 中 小 】 时间:2025年02月21日 来源:Nature Communications 14.7
编辑推荐:
本研究针对动物在环境切换中快速行为适应的神经机制,提出"意外事件驱动的少样本适应假说",通过设计行为动态分析方法和支持-保持/冲突-转移(SSCS)计算模型,发现纹状体中等棘神经元(D1/D2-MSNs)分别编码预期/非预期事件引导的行为策略,揭示了纹状体通路在快速环境适应中的特异性作用。该成果发表于《Nature Communications》,为理解决策神经环路提供新视角。
在动态变化的环境中,动物如何快速调整行为策略一直是神经决策科学的核心问题。传统强化学习(RL)理论认为行为适应是通过渐进式价值更新实现的,但越来越多的证据表明,生物体在面对环境突变时能表现出"少样本适应"能力——仅需极少数经验就能完成策略切换。这种快速适应现象与标准RL模型的渐进学习假设存在根本矛盾,暗示大脑可能采用更复杂的决策机制。
韩国科学技术院(KAIST)的研究团队在《Nature Communications》发表的研究中,通过创新性地设计行为动态分析框架,揭示了纹状体在仲裁不同行为策略中的核心作用。研究人员发现,动物对预期事件(支持事件)和意外事件(冲突事件)会触发截然不同的决策过程:前者强化现有行为(支持-保持),后者促进策略转换(冲突-转移)。这种双重机制突破了传统RL模型的局限,为理解生物快速适应能力提供了新范式。
研究采用四项关键技术方法:(1)多物种行为范式(大鼠两步任务、小鼠双臂赌博任务、T迷宫任务);(2)事件类型特异性行为动态分析(CI/CE指标);(3)支持-保持冲突-转移(SSCS)计算建模;(4)结合电生理记录(大鼠背内侧纹状体神经元)和化学遗传学干预(小鼠D1/D2-MSNs失活)的神经机制验证。
通过设计能区分支持事件(S+)和冲突事件(C+)的行为动态曲线,研究发现传统模型(MB/MF-RL)能解释支持事件后的行为,但完全无法预测冲突事件引发的策略转换。例如在两步任务中,大鼠经历连续支持事件后选择负向动作的概率CI(NS)逐渐降低,但冲突事件后的选择模式CE(NS)与模型预测相反(图2)。这种分离现象在三种反转学习任务和两种啮齿类动物中高度一致,证实意外事件触发独特的决策过程。
为解决传统模型缺陷,团队构建了包含双决策变量的SSCS模型(图3a):支持偏见(bS)强化当前策略,冲突偏见(bC)促进转换。该模型不仅准确预测反转学习中的快速适应(适应时间常数τ=5 trials),还揭示两种变量的不同动力学——支持偏见对情境反转响应更快(τ=6 trials),而冲突偏见调整更慢(τ=12 trials)。模型比较显示SSCS在预测冲突事件后行为方面显著优于MB/MF-RL、潜在状态模型等基线模型(图4f),其核心参数SSI(支持-保持指数)和CSI(冲突-转移指数)成为量化行为灵活性的新指标。
电生理数据分析发现,背内侧纹状体(DMS)存在分别编码bS和bC的神经元群体(图6b,e,f)。特别值得注意的是,这些神经元在T迷宫任务各阶段(准备、行动、奖赏、更新)均保持稳定表征,说明纹状体持续参与策略仲裁。 ventral striatum(腹侧纹状体)神经元也显示类似编码特性(补充图12),提示该机制可能具有跨纹状体亚区的普遍性。
通过化学遗传学干预小鼠D1R/D2R-MSNs,研究揭示了通路特异性贡献:D1-MSNs(直接通路)失活选择性削弱过去支持事件对当前决策的影响(SSI降低,图8c),而D2-MSNs(间接通路)失活特异性减弱过去冲突事件的作用(CSI降低,图8f)。这种双通路分离机制完美复现了SSCS模型的预测,证实纹状体通过并行通路分别整合预期和意外事件信息来指导行为适应。
这项研究通过创新性的行为分析框架和计算建模,确立了纹状体作为策略仲裁中枢的关键地位。其理论突破主要体现在三方面:(1)提出支持-保持/冲突-转移的双过程决策机制,解决了传统RL模型无法解释的少样本适应现象;(2)发现纹状体神经元群体特异性编码不同决策变量,为理解灵活行为的神经基础提供新证据;(3)揭示直接/间接通路在信息整合中的功能分工,完善了对基底 ganglia 环路计算原理的认识。这些发现不仅对决策神经科学有重要意义,也为开发类脑适应算法和干预精神疾病(如强迫症、成瘾等)的行为僵化症状提供了新靶点。正如通讯作者Sang Wan Lee?强调的,这项研究"建立了从计算原则到神经机制的行为适应统一解释框架"。
生物通微信公众号
知名企业招聘