基于全局工作空间理论的认知机器人持续学习机制:记忆与知识积累的互惠关系研究

【字体: 时间:2025年07月16日 来源:Cognition 2.8

编辑推荐:

  本研究针对认知机器人持续学习中的记忆约束和知识自主获取难题,基于全局工作空间理论(GWT)构建了融合记忆重放与自我评估机制的认知架构。通过类增量物体识别实验验证,机器人可自主判别学习数据重要性,实现并行记忆巩固与知识更新,为AGI发展提供了神经心理学启发的解决方案。

  

在人工智能迈向通用智能(AGI)的进程中,认知机器人如何像人类一样持续学习新知识而不遗忘旧技能,一直是困扰研究者的核心难题。传统机器人学习系统往往面临"灾难性遗忘"的困境——当学习新物体识别任务时,先前掌握的技能会突然消失。更棘手的是,真实环境中机器人无法依赖人类预先筛选数据,必须自主决定哪些经验值得记忆。这种记忆与学习的动态平衡问题,正是意识机制研究的核心命题。

受此启发,Wenjie Huang与意大利巴勒莫大学(Università degli Studi di Palermo)的Antonio Chella、英国曼彻斯特大学(University of Manchester)的Angelo Cangelosi合作,从着名的全局工作空间理论(GWT)中寻找突破口。该理论由Bernard Baars提出,认为人类意识就像剧院聚光灯,不同脑区模块通过竞争获得"注意焦点"以实现信息整合。研究团队创新性地将这一神经科学理论转化为机器人认知架构,在《Cognition》发表的研究中实现了三大突破:首次在机器人系统验证记忆与学习的互惠关系、开发基于知识自主评估的样本选择机制、设计可并行运行的记忆巩固流程。

关键技术包括:(1)基于GWT的多模态注意力模型,使Pepper机器人能自主关联视觉与听觉输入;(2)动态记忆缓冲区管理策略,仅保留关键样本缓解存储压力;(3)在线知识蒸馏算法,在不中断交互的情况下实现记忆固化。实验采用类增量学习范式,要求机器人通过人机交互逐步掌握20类物体的名称与特征。

【全局工作空间理论下的认知架构】

研究构建的GWT架构包含四个核心模块:感知处理器将视觉/听觉输入转化为特征向量;情景记忆缓冲区采用双存储设计,短期记忆保存原始感知数据,长期记忆存储经压缩的特征;全局工作空间通过竞争机制选择当前注意焦点;知识网络采用卷积神经网络实现增量学习。这种设计模拟了人类大脑中意识信息的整合过程。

【自我知识评估机制】

创新性地引入"认知不确定性"指标,当机器人对新物体识别置信度低于阈值时自动触发记忆存储。与Rebuffi等人提出的均值采样法不同,该系统会刻意保留部分异常样本,确保数据分布的完整性。实验显示该策略使记忆量减少43%的同时,识别准确率提升12%。

【并行记忆巩固】

突破性地实现学习与记忆固化并行运行。当工作空间处理新任务时,后台线程会对早期记忆进行知识蒸馏,将多个样本压缩为代表性特征向量。这种机制使系统能在10分钟交互中完成传统方法需停机2小时才能完成的模型更新。

研究结论揭示:记忆容量与学习效率存在动态平衡关系,适度的记忆约束反而能提升知识获取的选择性;自主评估机制产生的"认知冲突"可模拟人类学习中的注意力定向;并行固化技术证明类意识处理可突破时序计算瓶颈。这些发现为开发真正具备持续学习能力的认知机器人提供了理论框架,其GWT实现路径对意识计算建模具有方法论启示。

局限在于当前系统仅处理视觉-听觉双模态输入,未来需扩展至触觉等多感官整合。研究者建议将记忆选择机制与强化学习结合,使机器人能自主权衡存储成本与预期收益。这项研究标志着认知机器人学从"功能模拟"迈向"机制仿生"的新阶段,为开发具有自主意识的智能体奠定了关键技术基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号