编辑推荐:
在不确定环境中自适应决策需平衡探索与利用,此前背外侧前额叶皮层(DLPFC)在随机探索中的兴奋性和抑制性机制不明。研究人员结合经颅磁刺激(TMS)和脑电图(EEG)开展研究,发现右 DLPFC 的 N100 振幅与随机探索显著正相关,明确了前额叶抑制在探索行为中的重要性。
在复杂多变的世界里,人们每天都面临着各种决策。当处于不确定的环境中时,如何在探索新事物和利用已有经验之间找到平衡,就显得尤为关键。在科学界,这一探索与利用的平衡问题一直是研究热点。过往研究表明,自适应决策在不确定环境中至关重要,它涉及到探索未知可能性和利用已知信息的权衡。探索能够获取新信息,有助于未来做出更好的决策;而利用则是依靠现有知识来获取即时回报。计算模型将探索分为有向探索和随机探索,有向探索是有意识地寻求信息,随机探索则表现为随机的行为变化。
此前研究发现,背外侧前额叶皮层(DLPFC)与随机探索有关,但其中的兴奋性和抑制性机制却不清楚。了解这些机制,对于解释人们如何适应动态环境起着关键作用。为此,来自伊朗沙希德?贝赫什提大学(Shahid Beheshti University)认知与脑科学研究所的研究人员 Mojtaba Chizari、Keivan Navi 和 Reza Khosrowabadi 开展了一项研究,相关成果发表在《Scientific Reports》上。
为了深入探究这一问题,研究人员采用了经颅磁刺激(TMS)和脑电图(EEG)相结合的技术。TMS 可以刺激大脑特定区域,EEG 则能记录大脑的电活动,二者结合可以直接评估大脑皮层的兴奋性和抑制性功能。研究人员招募了 25 名健康参与者,让他们完成 Horizon 任务。这个任务设计巧妙,通过不同的信息条件和决策视野,能够区分有向探索和随机探索。参与者需要在两台提供概率奖励的老虎机之间做出选择,任务包含强制选择试验和自由选择试验。强制选择试验设置了 “信息相等” 和 “信息不等” 的条件,以此确保决策是基于探索行为而非奖励偏好。自由选择试验则设置了短视野(h1)和长视野(h6)两种情况,长视野鼓励探索,短视野更注重利用。在参与者完成任务后,研究人员对他们的 DLPFC 进行单脉冲 TMS,并检测 TMS 诱发的电位(TEPs)中的 N45、P60 和 N100,这些电位分别是 GABAA、GABAB和谷氨酸活动的神经生理学标记。
研究结果
- Horizon 任务行为结果:参与者在 Horizon 任务中的表现与以往研究相符。随着视野从 h1 延长到 h6,选择低平均奖励选项的概率 p (low mean) 显著增加(p (low mean) h1average=0.076,p(low mean) h6average=0.180;t (24)=6.114;p<.001),选择高信息选项的概率 p (high info) 也显著增加(p (high info) h1average=0.358;p(high info) h6average =0.507;t (24)=5.719;p<.001),这表明参与者在任务中同时进行了有向探索和随机探索。
- TMS - EEG 诱发电位:在 F3 和 F4 电极处均检测到了 N100 峰值,N45 和 P60 峰值也在多数参与者中被观测到。
- TMS - EEG 测量与任务参数的相关性:在长视野(horizon 6)条件下,代表在 “信息相等” 条件下选择低平均奖励选项概率的任务参数 plm6,与 F4 电极处 N100 峰值的振幅呈显著正相关(r=.49,puncorrected =0.013)。随机探索与 F4 电极处 N100 峰值的振幅也呈显著正相关(r=.63,puncorrected <0.001),经过错误发现率(FDR)校正后,该相关性仍然显著(r=.63,pcorrected =0.034)。而有向探索与 F3 电极处 P60 峰值的振幅呈显著负相关(r=-.47,puncorrected =0.027),不过该相关性在 FDR 校正后不再显著。
- 逻辑模型参数与 TMS - EEG 标记的相关性:研究人员进一步分析了逻辑模型参数与 TMS - EEG 标记的相关性。决策噪声参数(σ6)反映了决策中的随机变异性,对应随机探索。结果发现,长视野条件下的决策噪声参数与 F4 电极处 N100 振幅呈显著正相关(r=.46,pcorrected =0.022),FDR 校正后该相关性依然显著(r=.46,pcorrected =0.045)。这一结果进一步证实了右 DLPFC 和 GABA 介导的抑制过程在调节随机探索中的作用。
研究结论与讨论
这项研究揭示了探索策略背后的神经动力学机制。研究发现,随机探索与 F4 电极处 N100 振幅显著正相关,而 N100 是 GABA 介导的抑制过程的标记,这表明右 DLPFC 在管理不确定性下的行为变异性中起着关键作用。此前有研究使用脑刺激技术和神经成像研究表明了前额叶抑制的重要性,而该研究进一步提供了神经生理学证据,证明了前额叶抑制在探索行为中的因果作用。
研究还发现,有向探索与 F3 电极处 P60 振幅呈负相关,P60 与谷氨酸能兴奋性活动有关,这凸显了左 DLPFC 在平衡探索和利用中的作用。虽然该相关性在 FDR 校正后不显著,但依然为研究左 DLPFC 的功能提供了线索。
此外,研究结果支持了有向探索和随机探索依赖不同神经过程的观点。此前多项研究从不同角度证明了这一点,而该研究进一步表明,右 DLPFC 中的抑制可能是通过 GABA 相关的抑制过程来调节随机探索的。
同时,研究人员通过逻辑模型将行为变异性与右 DLPFC 的抑制过程联系起来,发现决策噪声参数与 N100 振幅的相关性,强化了随机决策受 GABA 介导的抑制调节的假设。
从更广泛的角度来看,GABAB介导的抑制可能通过维持皮层抑制和影响决策相关的振荡动力学来支持随机探索。前额叶皮层与其他脑区的相互作用,如与海马体和基底神经节的连接,可能在塑造探索 - 利用权衡中发挥更复杂的作用,这为未来研究提供了方向。
总的来说,该研究通过 TMS - EEG 技术,深入探究了 DLPFC 在随机探索中的神经机制,为理解人类在不确定环境中的自适应决策提供了重要依据,也为后续研究指明了方向,具有重要的科学意义。
研究人员主要运用了以下关键技术方法:
- 行为学实验:采用 Horizon 任务,让 25 名健康参与者在不同信息条件和决策视野下进行选择,以此评估探索行为,包括有向探索和随机探索。
- 神经电生理技术:结合经颅磁刺激(TMS)和脑电图(EEG)。TMS 用于刺激背外侧前额叶皮层(DLPFC),EEG 记录大脑电活动,检测 TMS 诱发的电位(TEPs)中的 N45、P60 和 N100,作为神经生理学标记。
- 数据分析方法:运用统计学方法,如配对样本 t 检验分析任务行为参数的变化,计算 Pearson 相关系数探究 TMS - EEG 标记与任务参数的关系,并使用错误发现率(FDR)方法校正多重比较。同时,采用逻辑模型,估计信息奖励和决策噪声等参数,辅助分析探索策略。