Orexin受体1拮抗对不确定性决策的影响：从学习机制到探索-开发平衡的神经调控

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月09日 来源：Behavioural Brain Research 2.6

编辑推荐：

　　本研究针对Orexin受体1(OX1 R)在决策行为中的调控机制，通过小鼠概率反转学习(PRL)任务，首次系统揭示了OX1 R拮抗剂1-SORA-51通过降低正向奖励学习率(αreward )和增加探索行为，影响不确定性环境下的决策过程。该研究为理解神经肽orexin在认知功能障碍及相关精神疾病中的治疗价值提供了重要证据。

在复杂多变的环境中，如何做出最优决策是神经科学领域的核心问题。Orexin/hypocretin神经肽系统作为连接觉醒与奖赏处理的关键枢纽，其通过OX₁
R和OX₂
R受体调控多种行为。临床观察发现，发作性睡病伴猝倒症(NT1)患者存在决策缺陷，但这是否直接源于orexin信号缺失尚不明确。针对这一科学问题，国外研究团队在《Behavioural Brain Research》发表的研究，通过创新性的交叉设计实验，揭示了OX₁
R拮抗对决策行为的双重调控机制。

研究采用雄性C57BL6/JArc小鼠建立概率反转学习(PRL)范式，通过交叉给予OX₁
R选择性拮抗剂1-SORA-51或对照剂，结合贝叶斯混合效应逻辑回归和强化学习建模，系统分析了40只小鼠在5天概率学习期和5天反转学习期的行为特征。

3.1 概率辨别学习
建模显示1-SORA-51显著延缓小鼠对高奖励杠杆的偏好形成（Day×Treatment交互项β=-0.219），证实OX₁
R拮抗损害初始学习能力。

3.2 探索行为
拮抗组在后期学习阶段仍保持较高杠杆转换率（Day×Treatment β=0.167），表明OX₁
R信号参与探索-开发平衡的调节。

3.3 强化学习机制
参数估计显示1-SORA-51选择性降低正向奖励学习率α_reward
（0.154→0.137），而对惩罚学习率α_omission
影响微弱，提示其对奖赏系统的特异性调控。

3.4 反应时间
拮抗组平均反应时间延长2.6秒（p=0.0306），可能与决策冲突增加或动机改变相关。

这项研究首次阐明OX₁
R通过双重途径调控决策：一方面通过腹侧被盖区(VTA)多巴胺通路调节奖赏学习效率，另一方面通过终纹床核(BNST)等区域影响探索行为。该发现不仅解释了NT1患者的决策缺陷机制，更为物质使用障碍等疾病的治疗提供了新靶点——通过调节OX₁
R信号可能改善病理性奖赏评估和决策模式。研究采用的交叉设计PRL范式为认知研究提供了可转化的行为模型，而强化学习框架下的参数化分析则为量化认知功能提供了新方法。

值得注意的是，OX₁
R拮抗导致的"过度探索"现象暗示其在强迫症等行为抑制障碍中的潜在应用价值。未来研究可结合光遗传学等技术，进一步解析orexin神经元亚群在决策不同阶段的特异性作用。该工作为理解神经调质系统如何整合认知与情绪信息做出了重要贡献，为发展精准化认知干预策略奠定了理论基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号