瞳孔大小通过前额叶动态临界减速预测探索行为
《Communications Biology》:Pupil size predicts exploration through critical slowing in prefrontal dynamics
【字体:
大
中
小
】
时间:2025年12月22日
来源:Communications Biology 5.1
编辑推荐:
本研究针对决策过程中探索行为的发生机制这一关键问题,通过同步记录瞳孔大小和前额叶神经元群体活动,揭示了瞳孔波动可作为探索行为启动的“早期预警信号”。研究人员发现,瞳孔直径的特定振荡相位与探索行为的起始密切相关,并且这种关系由前额叶眼动区(FEF)神经活动紊乱和决策过程减速所介导。该研究首次将探索行为与临界相变理论联系起来,为理解自主 arousal 系统如何调控高级认知状态转换提供了新视角。
在充满不确定性的环境中,智能决策者面临一个根本性难题:是应该“利用”(exploit)已知能带来回报的策略,还是应该“探索”(exploit)可能更具潜力的新选项?这种“探索-利用权衡”(explore-exploit trade-off)是强化学习、经济学和认知神经科学的核心问题。虽然利用行为可以直接最大化即时奖励,其神经基础已得到较多研究,但驱动探索行为的内在机制,尤其是其神经生物学基础,至今仍不甚清晰。
以往研究曾将探索行为与瞳孔大小(pupil size)联系起来,后者是自主神经 arousal 状态的一个外周指标。然而,一个关键的悬而未决的问题是:瞳孔直径仅仅是反映了那些使探索更可能发生的环境变量(如奖励波动性、意外性),还是能够直接预测探索行为本身及其神经基础?为了回答这个问题,研究人员设计了一项精巧的实验。
这项发表在《Communications Biology》上的研究,由 Akram Shourkeshti、Mojtaba Abbaszadeh 等学者领导完成。研究团队让两只雄性恒河猴执行一项动态的三臂老虎机任务(three-armed bandit task),在此过程中同步记录它们的瞳孔直径以及前额叶皮层(prefrontal cortex)神经元的群体活动。该任务的关键在于,三个目标的奖励概率会独立地随机游走,迫使猴子必须不断地在利用当前最佳选项和探索其他选项之间进行切换。
为了精确区分探索和利用行为,研究人员没有采用传统的强化学习(Reinforcement Learning, RL)模型(该方法将探索等同于奖励最大化错误),而是使用了隐藏马尔可夫模型(Hidden Markov Model, HMM)。HMM 能够从纯粹的选择序列中识别出潜在的“探索”和“利用”状态,而不对内在的价值计算过程做任何假设。研究结果证实,HMM 方法在解释行为和神经活动的方差方面优于 RL 方法,能更准确地区分不同的行为模式。
研究团队在两只雄性恒河猴进行探索-利用决策任务时,使用红外眼动仪(Eyelink)在恒定光照条件下测量瞳孔直径,并利用植入前额叶眼动区(Frontal Eye Field, FEF)的16通道U型探针(Plexon)记录神经元活动。核心分析方法包括:应用HMM对行为模式进行状态分类;采用广义线性模型(GLM)分析瞳孔大小、行为指标和神经活动之间的关系;利用靶向降维(targeted dimensionality reduction)技术提取神经群体活动中与选择预测相关的子空间信息;通过结构方程模型(Structural Equation Modeling, SEM)进行中介效应分析;以及使用小波分析(wavelet analysis)检测瞳孔波动相位与探索起始点的关系。
研究人员首先发现,在恒定光照下,被标记为“探索”的试次中,瞳孔直径显著大于“利用”试次,这与前人研究一致。然而,深入分析揭示了两者之间并非简单的线性关系。当绘制探索概率随瞳孔大小变化的曲线时,呈现出独特的U形关系:即瞳孔非常小和非常大时,探索的概率都较高。
为了解开这个U形之谜,研究人员细致考察了瞳孔大小在探索行为发生前后的动态变化。结果发现,瞳孔直径在探索开始前的数个利用试次中就已经开始逐渐“爬升”(ramping up),在探索起始点时达到峰值。一旦探索开始,瞳孔大小便立即开始收缩,在探索序列的后期以及随后的利用试次中,瞳孔直径甚至低于基线水平。这表明,U形关系主要是由于探索行为本身对瞳孔大小产生了“重置”效应:探索启动后瞳孔迅速缩小,导致序列中后期的探索试次伴随着较小的瞳孔。
更重要的是,瞳孔大小特异性地预测了探索的“起始”(onset),即从利用状态首次切换到探索状态的时刻,而不是所有探索试次或状态切换本身。这种预测关系在排除了奖励历史的影响后依然存在。进一步的分析甚至显示,最能预测探索起始的瞳孔信号并非来自紧邻的前一个试次,而是来自更早(如t-4, t-5试次)的瞳孔相位。探索起始倾向于发生在瞳孔振荡的上升相位,而这种振荡的频率(约0.06-0.09 Hz)与自主神经系统中著名的梅耶波(Mayer wave)频率相符。这表明,奖励 omission 等外部事件需要与内在的 arousal 振荡相位“同相”才能有效触发探索。
在神经机制层面,研究聚焦于前额叶眼动区(FEF)。此前已知,FEF神经元在利用状态下能够较好地预测即将做出的选择,而在探索状态下,这种选择选择性(choice selectivity)会减弱,表现为神经群体活动的“紊乱”。本研究发现,瞳孔大小能够预测这种神经编码的变化。
在单个神经元水平,随着瞳孔增大,神经元对不同选择目标的选择性调谐曲线(tuning curve)变得更为平坦。在神经群体水平,研究人员通过靶向降维技术聚焦于“选择预测子空间”(choice-predictive subspace)。他们发现,更大的瞳孔直径预示着从群体活动中解码选择信息的准确性降低(即解码选择概率下降),同时,衡量相同选择下神经活动变异度的“散射指数”(scatter index)升高。重要的是,这些效应在仅分析利用试次时仍然显著,说明瞳孔大小对神经编码的影响超越了探索/利用状态本身的差异,反映了 arousal 对前额叶网络动态的更为普遍的调节作用。
那么,瞳孔波动是如何最终导致探索行为的呢?研究人员通过中介分析(mediation analysis)发现,前额叶神经活动的紊乱(以散射指数为代表)部分地介导了瞳孔大小对探索起始的预测作用。这意味着,瞳孔-linked 的 arousal 可能通过扰乱前额叶中稳定的选择表征,为探索行为创造了神经条件。
此外,研究还发现了探索行为的一个潜在新特征——“临界减速”(critical slowing)。这是复杂系统在接近临界相变(critical transition)或“引爆点”(tipping point)时的一个经典早期预警信号。行为上,在探索开始前的试次中,反应时间(response time)逐渐变慢。神经活动上,在选择预测子空间中,神经状态的变化速度(neural speed)也减慢了。这两种“减速”现象均无法由奖励历史单独解释,但都能被较大的瞳孔直径所预测,并且它们同样介导了瞳孔与探索起始之间的关系。这支持了探索行为可能是前额叶网络动力学的一个临界相变的观点。
本研究系统地阐明了瞳孔-linked 的 arousal 系统在驱动探索行为中的关键作用。其重要意义在于:
- 1.机制深化:它超越了瞳孔大小 merely 关联于环境变量的层面,证明瞳孔波动能直接、特异性地预测探索行为的起始,并且这种预测作用由前额叶神经编码的紊乱和决策过程的减速所介导。
- 2.理论创新:首次将探索行为与临界相变理论联系起来,提出了探索可能是前额叶网络在 arousal 驱动下通过一个临界引爆点的结果,为理解高级认知状态的转换提供了新的理论框架。
- 3.因果假设:研究结果与去甲肾上腺素(Norepinephrine, NE)等 neuromodulators 可能通过扁平化神经元调谐曲线、促进网络“重置”(reset)来推动临界相变的假说一致,为后续的因果性实验(如药理干预或光遗传学操控)指明了方向。
- 4.方法学贡献:证明了HMM在区分探索/利用状态上的优势,以及结合瞳孔测量、神经记录和计算建模等多维度数据在解析复杂认知过程动力学中的强大能力。
总之,这项研究揭示了我们的身体(通过瞳孔)和大脑(通过前额叶动态)如何协同工作,在不确定的环境中智能地平衡保守与冒险。它不仅增进了我们对决策基本过程的理解,也为研究其他涉及状态转换的认知过程(如注意力转换、认知灵活性)提供了新的思路和方法。未来,通过操控特定的神经调制系统,或将能验证其因果角色,并探索这些机制在精神疾病(如焦虑症、强迫症,这些疾病常伴有探索行为异常)中的变化。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号