编辑推荐:
本文通过训练小鼠完成双选线索 - 延迟 - 选择(2ACDC)任务,利用双光子钙成像技术记录海马体 CA1 区神经元活动。发现学习过程中海马体神经活动逐步去相关并形成正交化表征,类似状态机。克隆结构因果图(CSCG)模型能复现这一过程,为理解认知地图形成机制提供重要依据。
学习产生正交化状态机的研究背景
在神经科学领域,认知地图是动物理解环境、与外界互动的关键神经构建。自 “位置细胞” 在海马体被发现后,认知地图的研究不断深入,但其算法形式和学习机制仍不明确。本研究借助大规模、纵向双光子钙成像技术,记录小鼠学习复杂任务时海马体 CA1 区数千神经元的活动,旨在揭示认知地图在学习过程中的形成机制。
学习双选线索 - 延迟 - 选择任务
研究人员训练表达 GCaMP6f 的转基因小鼠在虚拟现实环境中执行双选线索 - 延迟 - 选择(2ACDC)任务。小鼠需根据视觉线索判断水奖励的位置,任务包含两个线性轨道,奖励区有近(R1)、远(R2)之分,由不同的指示线索(Ind)预测。
训练初期,小鼠在黑暗中于球形跑步机上随机获取水奖励,之后开启虚拟现实环境进行正式训练。训练过程中,小鼠的舔舐行为逐渐优化,从最初的随机舔舐,到在两个奖励区都舔,再到收集奖励后停止舔舐,最终仅在正确奖励区附近舔舐,表现出逐步提升的学习过程。通过系数 of 部分 determination 分析发现,这四种行为策略在学习过程中依次发挥主导作用,且与小鼠跑步速度的变化相呼应。
学习过程中海马体活动的成像
实验前,小鼠被植入颅骨窗,利用双光子随机 access 显微镜对海马体 CA1 区神经元活动进行成像。该技术可清晰分辨和识别大量神经元,在多个训练和成像 sessions 中,每只小鼠平均能记录到数千个细胞。
学习初期,许多神经元在轨道上有明显活动,且在不同 trial types 中的活动有相似性,尤其在灰色区域。随着训练的进行,神经元活动在单个 trial type 内(如不同灰色区域间)和不同 trial types 对应位置间的差异逐渐增大,表明海马体对任务的表征越来越精细。
学习过程中海马体的系统性变化
通过计算近、远 trial types 的群体向量相关性,研究发现训练过程中特定位置的相关性系统降低。如在指示线索区域,由于视觉刺激不同,相关性较低;而轨道上的四个灰色区域,在训练初期相关性适中,到第三 session 时显著降低,说明海马体对这些视觉相似区域的表征逐渐正交化。此外,不同 trial types 对应位置的相关性也有序降低,通常远奖励区前(pre - R2)的神经活动比近奖励区前(pre - R1)更早去相关,这一过程与小鼠舔舐行为的改善同步发生。
海马体正交化状态机(OSM)表征
利用均匀流形近似和投影(UMAP)技术对神经活动进行可视化,发现其动态变化呈现出明显的阶段性特征。初始 session 时,神经活动按感觉线索聚类,整体结构相对无序;第二天呈现 “hub - and - spoke” 结构;到第三 session,形成环状结构;随着训练推进,两个 trial types 的活动轨迹愈发 distinct,最终类似 split - shank wedding ring 结构。这种变化反映了海马体在学习过程中逐渐形成了类似状态机的结构,即正交化状态机(OSM),它能有效表征任务的潜在状态。
OSM 形成过程中的单细胞调谐变化
在学习过程中,神经元的调谐特性发生显著变化。早期,原本对多个灰色区域有反应的神经元变得更具选择性,只在少数或单个灰色区域放电。随着学习深入,神经元在近、远 trial types 的预奖励区域(pre - R1 和 pre - R2)表现出更明显的差异,出现了 “splitter cells”,即对不同 trial type 有不同反应的神经元。
通过计算差异分数和相关性系数,可将细胞的调谐反应分为 “splitter” 反应、“place” 反应和 “remapping splitter” 反应等类别,这些类别在学习过程中逐渐变化。如指示线索区域的细胞迅速转变为能更完全区分不同视觉线索的反应,而奖励和预奖励区域的细胞则从类似 “place” 的反应逐渐转变为 “splitter” 反应。
海马体图谱与计算模型
研究分析了多种计算模型,以探究哪种模型能更好地解释海马体的学习算法。其中,基于隐马尔可夫模型(HMM)的克隆结构因果图(CSCG)模型表现突出。CSCG 通过发现状态间的转移矩阵来预测感觉序列,其学习的状态转移与任务架构紧密相似,且能复现海马体神经动力学的关键特征,包括最终的正交化表征和学习轨迹。
相比之下,传统的循环神经网络(RNN),如使用整流线性或 sigmoid 激活函数的 RNN,在预测下一个感觉输入时虽能达到较高准确率,但不会自然产生类似海马体活动的正交化表征。长短期记忆网络(LSTM)和 transformers 等复杂神经网络架构,也需要明确鼓励学习正交化表征才能实现。而具有软赢家通吃(sWTA)机制和 Hebbian 可塑性的 RNN(Hebbian - RNN),能够学习到 2ACDC 任务的正交化表征,表明生物合理的学习机制有助于构建类似海马体的表征。
现有海马体状态机的适应能力
为研究学习到的海马体状态机对新任务特征的适应能力,研究人员对任务进行了扩展和修改。首先,在小鼠学会原任务的指示线索后,更换为陌生的视觉模式。结果发现,小鼠能快速学习新线索,且新任务的神经活动与原任务在除指示区域外的其他区域高度相似,表明已建立的状态机可有效重用。
其次,延长任务中灰色区域的长度后,小鼠在拉伸 trial 中的舔舐行为和神经元调谐位置发生变化。如在拉伸的近 trial 中,神经元活动在延长段持续;而在拉伸的远 trial 中,神经元迅速调整调谐位置,这表明神经表征能根据任务变化灵活调整,以适应不确定的情况。
讨论
本研究全面展示了小鼠在学习虚拟现实任务过程中海马体认知地图的形成过程。认知地图具有状态机的特征,其正交化表征的形成与任务性能的提升同步。计算模型表明,许多 OSM 的特征与 CSCG 模型相似,CSCG 通过期望最大化算法学习,能有效捕捉海马体学习的关键算法特性。
不同的计算模型在模拟海马体功能时各有优劣。RNN 在特定条件下可产生正交化表征,但学习动态与动物实验不完全匹配。CSCG 的成功得益于其训练方式、解耦潜在动态与观察的能力以及离散表征的使用。这为理解海马体认知地图的形成机制提供了重要线索,暗示局部 Hebbian 学习和具有适当架构选择的梯度下降学习足以构建正交化地图。
然而,海马体认知地图的形成可能涉及多种可塑性机制的协同作用,包括 Hebbian 可塑性和反馈基可塑性等。其他脑区的可塑性也可能对海马体的神经活动产生影响。未来的研究应进一步明确不同学习规则在认知地图形成和利用中的具体作用和相互作用,以及这些过程的分子机制。
此外,本研究还对传统的细胞类型分类提出了挑战,发现单细胞调谐具有连续性,神经元在学习过程中动态转换功能角色。研究成果为理解生物认知地图形成的基本原理提供了重要依据,也为开发更复杂的人工智能系统提供了指导。未来的研究方向包括进一步完善模型以解释动物中观察到的正交化序列,以及探究海马体与新皮层表征在学习过程中的相互作用。