在规划与地图制作之间：当未来目标尚不明确时，如何优先考虑可重复的游戏体验

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年10月28日 来源：Neuron 15

编辑推荐：

　　海马体重放机制通过整合“地图”和“规划”假说，提出基于环境统计和未来相关性的统一模型，有效解释了不同目标切换任务中的重放模式差异。

亮点

•

一种用于海马体重放的规划强化学习模型被推广应用于认知地图的构建

•

该模型解释了在目标切换速度较慢的任务中出现的具有“地图特征”的重放现象

•

该模型还解释了在目标切换速度较快的任务中出现的具有“规划特征”的重放现象

•

该模型从环境统计的角度统一了“地图”和“规划”两种类型的重放机制

总结

尽管关于海马体重放的实证研究结果很多，但其计算功能仍存在争议。“价值”假说认为重放过程规划了通往当前目标的路径，而“地图”假说则认为重放过程构建了一种与当前目标不同的抽象环境表征。数据似乎支持这两种观点，但最近的研究发现动物在学习达到当前目标的过程中，重放行为实际上是滞后的而非引领性的，这给“规划”假说带来了挑战。然而，由于缺乏形式上的具体说明（尤其是关于“地图”假说的部分），区分这两种观点非常困难。我们通过扩展一种著名的规划理论来解决这些分歧，该理论将规划范围扩展到未来目标以及当前目标——实际上就是构建了一张“地图”。重放行为是更倾向于当前目标（如规划过程）还是其他目标（如地图构建过程），取决于这些目标在未来可能的重要性。这一解释调和了这两种观点，并与大量数据相符，揭示了这些看似不同的假说之间的深刻联系。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号