基于单因素可塑性的灵活记忆与学习新机制:非赫布可塑性的关键作用
【字体:
大
中
小
】
时间:2025年02月25日
来源:SCIENCE ADVANCES 11.7
编辑推荐:
为解决赫布可塑性(Hebbian plasticity)在解释一次性情景记忆形成方面的不足,[未提及具体机构] 的研究人员开展了关于一次性情景记忆模型的研究,发现非赫布可塑性足以支持灵活的记忆和学习,这一成果有助于理解记忆形成机制。
在神经科学领域,记忆的形成机制一直是研究的热点与难点。长久以来,赫布可塑性理论 —— 即反复共同激活的神经元之间突触连接会增强,被认为是记忆形成的神经基础。其典型的实现机制是 spike-timing dependent plasticity(STDP,一种依赖于突触前和突触后神经元放电时间的可塑性机制,若突触后神经元在突触前神经元放电后立即产生动作电位,突触会增强 )。然而,在现实世界中,像与朋友的一次对话、新发现的觅食路线等一次性的复杂情景记忆,STDP 似乎难以胜任。因为 STDP 通常需要多次重复的神经活动模式才能产生显著效果,且其时间窗口很短,一般在 10 - 20 毫秒,最长也不过 100 - 200 毫秒,而实际行为中的时间间隔可能长得多。这就好比让一个短跑选手在马拉松比赛中按照短跑的节奏去跑,显然是不合适的。此外,STDP 对放电变异性较为敏感,也难以存储低放电率活动模式的记忆。这些问题使得人们开始思考,一次性情景记忆的形成是否存在其他机制。
为了深入探究这个问题,[未提及具体机构] 的研究人员开展了一项关于一次性情景记忆模型的研究。他们提出了一种由更简单规则支配的情景记忆模型,该规则仅依赖于突触前活动(presynaptic activity)。研究结果表明,这种规则借助高维神经活动和受限的状态转换,能够自然地将情景记忆存储为通过复杂状态空间(如世界模型所基于的状态空间)的路径。由此产生的记忆痕迹被称为路径向量(path vectors),它具有很强的表达性,并且可以通过气味追踪算法进行解码。这一发现为理解记忆形成机制开辟了新的道路,相关研究成果发表在Science Advances期刊上。
在研究过程中,研究人员主要运用了以下几种关键技术方法:
- 构建理论模型:设计了包含可塑性规则、状态空间、编码网络和解码算法的情景记忆模型,用于模拟记忆的存储和检索过程。
- 数学分析与推导:通过数学公式描述模型中各组件的行为和相互关系,分析模型的性能和特性。
- 计算机模拟实验:利用计算机模拟不同的情景和任务,测试模型在各种情况下的表现,验证模型的有效性。
下面具体来看研究结果:
- 单因素可塑性支持通过复杂状态空间存储和回忆路径
- 模型组件及原理:研究人员构建的模型中,可塑性规则是仅依赖突触前活动的长时程增强(LTP,long - term potentiation)规则,并允许权重以缓慢时间常数 τ<sub>w</sub>衰减。状态空间采用世界模型的形式,其状态和转换统计可用有向图表示。编码网络将世界模型状态转换为稀疏、近似二进制的高维(HD,high - dimensional )神经代码,不同状态的 HD 代码近似正交。解码算法则通过追踪熟悉度信号在状态空间中回溯路径。
- 完整存储和检索过程:在情景发生前,将代理置于特定起始状态并将权重向量 w<sub>0</sub>设为 0。随着情景的展开,状态沿世界模型路径演化,每个访问的状态通过编码网络生成 HD 代码,进而更新路径向量 w<sub>t</sub>。回忆时,代理再次置于起始状态,通过解码算法回溯路径来重建情景。结果表明,在一定条件下,路径向量能完美存储路径并实现高效解码。
- 单因素可塑性在现实放电情况下是 STDP 的可靠替代方案
- 对比实验设计:研究人员比较了基于尖峰的单因素规则和 STDP 规则。在模拟实验中,设置了一个突触 w*,分别应用这两种规则。单因素规则中,高于一定频率的突触前尖峰可触发权重增强,低频率或零频率则导致权重衰减。STDP 规则中,只有在特定时间窗口内的突触前和突触后尖峰对才能触发可塑性变化。
- 实验结果:在模拟状态转换的实验中,单因素规则在较大的放电率范围内产生更多的增强事件。在存储简单情景记忆的实验中,单因素规则在各种参数条件下都比 STDP 更可靠,这表明单因素规则在存储熟悉度方面是 STDP 的有效替代方案。
- 路径向量支持多种记忆任务
- 空间和非空间世界模型中的路径记忆:通过在二维开放环境和具有特定结构的非空间世界模型中进行实验,研究人员发现路径向量能够存储和回忆通过这些世界模型的轨迹。回忆准确性与轨迹长度和 N(神经元数量)有关,这说明路径向量可用于存储不同类型世界模型中的情景记忆。
- 基于熟悉度的时间内容编码:尽管之前假设每个状态的停留时间相同,但单因素规则实际上可以自然地存储状态停留时间的时间变化。较长的停留时间会使状态在路径向量中的熟悉度增加。虽然这会增加错误熟悉度率,但通过引入放电率适应机制可以抑制这种影响,从而实现对时间内容的有效编码。
- 通过学习嵌入空间中的路径实现任意序列和关联:对于不遵循世界模型相邻状态结构的序列,研究人员通过将其映射到预先存在的状态空间(如学习嵌入空间)中的明确路径来解决编码问题。在嵌入空间中,利用辅助状态构建连接项目状态的路径,从而实现对任意序列和关联的记忆。
- 路径向量的聚合与组合记忆:路径向量可以通过聚合多个情景记忆来构建复合路径向量。当两个路径向量相加时,它们编码的状态的并集会被存储。这种机制不仅支持不同任务的记忆存储,还能在状态重叠时产生新的回忆模式,例如通过复合路径向量进行项目采样。
- 分支点与回忆错误:当路径中存在具有多个下游熟悉状态的分支点时,可能会导致回忆错误。分支点的出现概率与状态空间结构和路径构建方式有关。研究人员提出了两种解决方法,一是利用状态空间的空间结构和额外的变量(如方向或动量)来优先选择正确的下一个状态;二是将情景编码为通过辅助状态空间的无分支路径,这类似于使用记忆技巧来编码情景。
- 通过奖励驱动的路径向量学习策略
- 实验设置:研究人员扩展了二维导航模型,使其在奖励环境中运行。在模拟实验中,代理在每次试验中探索环境并存储路径向量,根据奖励情况更新一个永久的奖励依赖表示 p。
- 学习过程与结果:随着试验次数的增加,代理逐渐学习到环境的表示,靠近奖励的位置熟悉度增加,最终学会到达奖励位置。研究还发现,在路径向量学习中引入空间相关性可以加速学习过程。与传统的基于价值的时间差分(TD,temporal difference )学习相比,路径驱动学习在速度和精度上呈现不同的权衡。
- 单因素模型为海马可塑性机制提供了新的视角
- MF 突触的突触前增强:研究人员模拟了海马苔藓纤维(MF,mossy fiber )突触从齿状回(DG,dentate gyrus )到 CA3 区域的可塑性机制。结果表明,MF 突触能够通过类似单因素规则的机制编码状态熟悉度,并且可以存储顺序组织的情景记忆,这挑战了传统认为 MF 突触仅为 CA3 区域记忆存储提供辅助控制的观点。
- CA3 - CA1 突触的 BTSP:研究人员对行为时间尺度突触可塑性(BTSP,behavioral timescale synaptic plasticity )进行建模,该可塑性规则存在于 CA3 到 CA1 的突触中。模拟结果显示,BTSP 不仅支持情景记忆的存储和回忆,还能通过稀疏的突触后平台电位存储额外的时间信息,类似于时间上下文模型(TCM,temporal context model )中项目与编码时间位置的绑定,但使用的是非赫布规则。
- 短期到长期存储的转换:研究人员提出,MF 记忆痕迹最初通过囊泡积累编码情景,如果没有重新激活则会衰减。但重新激活 MF 记忆痕迹可以通过两种方式触发长期存储,一是顺序重新激活状态触发 CA3 - CA1 突触的 BTSP,二是 DG 颗粒细胞同步放电激活 CA3 细胞,进而引发一系列可塑性变化,实现情景表示的再激活和长期存储。
在结论与讨论部分,研究人员强调了单因素可塑性在情景记忆和学习中的重要意义。他们提出单因素规则结合结构化状态空间可以作为记忆形成的替代模型,挑战了传统的赫布模型。此外,将情景表示为通过丰富状态空间的路径这一观点,在记忆与策略的关系、对回忆的影响以及在一次性学习中的优势等方面具有重要意义。同时,研究还对其他学习算法产生了影响,为理解记忆和学习机制提供了新的思路。该研究也提出了一些可测试的预测,如损害赫布可塑性不应损害一次性情景记忆等,为后续研究指明了方向。虽然模型存在一些局限性,如存储容量有限等,但也为未来的研究提供了扩展和改进的方向。
综上所述,这项研究通过构建新颖的情景记忆模型,揭示了非赫布可塑性在记忆和学习中的关键作用,为神经科学领域对记忆形成机制的理解带来了新的突破,也为后续相关研究奠定了重要基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号