
-
生物通官微
陪你抓住生命科技
跳动的脉搏
前额叶VIP神经元在概率逆转学习中的选择性参与机制及其对行为灵活性的调控作用
【字体: 大 中 小 】 时间:2025年07月25日 来源:SCIENCE ADVANCES 11.7
编辑推荐:
为解决大脑如何适应复杂多变环境的问题,研究人员聚焦内侧前额叶皮层(mPFC)中血管活性肠肽(VIP)神经元,通过钙成像和光/化学遗传学技术,揭示了VIP神经元在概率逆转学习中的独特作用:其通过编码奖赏预测误差(RPE)信号特异性驱动行为逆转,而对稳定环境下的渐进式价值更新无显著影响。该研究为理解皮层微环路如何支持多维度行为适应提供了新视角。
在瞬息万变的环境中,生物体需要不断调整行为策略以适应新的环境规则。这种被称为"行为灵活性"的高级认知功能,对生存至关重要。然而,大脑如何在复杂多变的情境中快速识别环境变化并作出适应性调整,其神经机制尚未完全阐明。特别是当环境信号具有概率性特征时——比如某个线索仅以75%概率预示奖励——这种不确定性进一步增加了行为适应的难度。传统研究多关注特定脑区在单一类型行为灵活性中的作用,而对同一神经环路如何整合多种适应策略的关注不足。
针对这一科学问题,韩国科学技术院(KAIST)的研究团队以小鼠内侧前额叶皮层(medial prefrontal cortex, mPFC)为研究对象,重点考察了其中表达血管活性肠肽(vasoactive intestinal polypeptide, VIP)的抑制性神经元在概率逆转学习中的功能。mPFC作为执行控制的关键脑区,既往研究显示其参与多种行为灵活性任务,但对其内部特定神经元类型的分工知之甚少。VIP神经元作为皮层抑制性网络的重要调控者,仅占皮层神经元的少量比例,却通过抑制其他抑制性神经元(如表达小清蛋白(parvalbumin, PV)的快发放中间神经元)产生"去抑制"效应,从而对局部神经网络产生放大式调控。研究人员推测,这类"调控者的调控者"可能在需要高度灵活性的行为情境(如环境规则突然改变时)发挥特殊作用。
为验证这一假说,研究团队综合运用多种前沿技术:在VIP-Cre转基因小鼠mPFC中,通过化学遗传学(hM3Dq/hM4Di)双向调控神经元活性;结合梯度折射率棱镜(GRIN lens)植入和单光子钙成像技术记录VIP神经元活动;采用头固定行为范式实施概率性逆转学习任务(含75%奖励/惩罚概率);通过线性混合效应模型分析神经元编码特性;并引入ANCCR计算模型解析学习算法特征。
结果部分呈现以下重要发现:
VIP神经元活性调控特异性影响逆转学习
化学遗传学激活(hM3Dq)或抑制(hM4Di)VIP神经元均显著延长达到逆转标准所需的试验次数(P<0.01),但不影响逆转前的概率性条件反射。光遗传学特异性在结果期激活VIP神经元(ChRmine,20Hz)同样损害逆转学习,证实其时间特异性作用。
VIP神经元动态编码环境变化信号
钙成像显示,VIP神经元在遭遇首个意外奖励后,线索反应出现短暂抑制(P=3.5×10-4),该效应在惩罚刺激中未出现。这种奖励特异性信号提示VIP神经元可能作为"环境变化检测器"。
阶段特异性RPE编码
逆转期间VIP神经元在结果期表现出显著的RPE信号(CSrw与Reward编码呈负相关,r=-0.378,P=6.3×10-5),而在稳定期无此特性。相比之下,锥体神经元(PP)在所有阶段均保持RPE编码。
信号持续性与行为效率相关
VIP神经元的RPE信号动态早于行为逆转(约40个试验),且信号持续时间与个体学习速度显著正相关(r=0.824,P=0.003)。ANCCR模型分析进一步验证了PR[CSrw←Rw]信号的预测价值。
环路层面的调控作用
当抑制VIP神经元时,锥体神经元的线索偏好逆转能力受损,证实VIP→Pyramidal的跨神经元调控是行为灵活性的环路基础。
这项发表于《SCIENCE ADVANCES》的研究首次阐明:mPFC的VIP神经元构成一个专门监控环境突变的"预警系统",其通过阶段性参与RPE计算促进快速行为适应。这种功能分离(VIP负责"何时改变",PP负责"如何改变")为理解皮层信息处理的分层组织提供了新框架。在医学意义上,VIP神经元的功能异常可能与强迫症、成瘾等行为灵活性障碍相关,为靶向干预提供了潜在新靶点。研究创新的滑动窗口分析方法和ANCCR模型的应用,也为计算神经科学研究提供了方法学参考。未来研究可进一步探索VIP神经元与其他调制系统(如多巴胺能投射)的协同机制,以及其在更复杂决策情境中的作用模式。
生物通微信公众号
知名企业招聘