
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于小脑-基底节-海马协同仿生的移动机器人动态行为决策模型研究
【字体: 大 中 小 】 时间:2025年06月25日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对移动机器人在未知动态环境中决策能力不足的问题,研究者通过模拟小脑(Cerebellum)监督学习、基底节(Basal Ganglia)强化学习及海马体(Hippocampus)记忆巩固机制,构建了MDN-2(Motivated Developmental Network 2)与SAPM(State-Action Prediction Method)融合的混合决策模型。实验表明该模型显著提升了机器人动态环境适应性与持续学习能力,为类脑智能决策提供了新范式。
在人工智能与机器人技术快速发展的今天,移动机器人已逐步渗透到工业、医疗、服务等众多领域。然而,当面对未知或动态变化的环境时,传统机器人往往表现出决策能力不足、学习效率低下等问题。这就像让一个只会按固定路线行走的人突然置身于错综复杂的迷宫中——缺乏灵活应变的能力。究其原因,在于现有算法多针对特定场景设计,难以像人类大脑那样通过多脑区协同实现通用智能决策。
针对这一挑战,中国的研究团队从神经生物学中获得灵感,提出了一种模拟小脑、基底节和海马体功能的混合决策模型。这项发表在《Engineering Applications of Artificial Intelligence》的研究,通过创新性地整合三大脑区的计算原理,使机器人首次具备了类人的动态环境适应能力。
研究团队采用了三项关键技术:首先设计基于动机发育网络2(MDN-2)的小脑模块,通过隐藏神经元侧向连接实现环境特征精确表征;其次构建海马体记忆巩固模块,实现离线知识整合;最后提出状态-动作预测方法(SAPM),优化小脑与基底节的协同决策机制。实验数据来自动态仿真环境和真实物理场景的双重验证。
设计决策模型
通过MDN-2重构小脑功能,其双隐藏层结构与三区域划分显著提升了环境特征提取能力。海马体模块采用记忆重放机制,使机器人能持续积累经验。SAPM方法通过评估小脑(监督学习)与基底节(强化学习)的输出权重,实现了动态环境下的最优决策。
仿真实验
在包含突变障碍物的虚拟环境中,新模型路径规划成功率较传统方法提升37.2%,且学习速度提高2.1倍。特别在光照突变等干扰条件下,决策稳定性保持90%以上。
物理实验
搭载于TurtleBot3平台的实测显示,新模型在陌生办公环境中自主避障响应时间缩短至0.3秒,任务完成率较前代模型提高42%。长期测试表明,其通过记忆巩固可使相同场景的二次任务效率提升58%。
结论
该研究首次实现了小脑-基底节-海马体全通路仿生的机器人决策系统。MDN-2的侧向连接机制解决了动态环境表征难题,海马体模块突破了持续学习瓶颈,SAPM方法则为多脑区协同提供了量化标准。这不仅为智能机器人提供了新的技术路径,更对类脑计算领域的基础理论发展具有启示意义。团队特别指出,未来可通过引入前额叶皮层(Prefrontal Cortex)的认知控制功能,进一步逼近人类决策的层次化特性。
生物通微信公众号
知名企业招聘