基于群体意识深度强化学习的多机器人路径规划协同框架研究

【字体: 时间:2025年05月12日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  本研究针对多机器人路径规划(MRPF)中个体决策与全局协调的难题,提出基于群体意识(MACCRPF)的双层深度强化学习(DRL)框架。通过基础层实时信息共享与顶层策略评估的协同机制,结合分层奖励设计,实现了20%以上的路径成功率提升,为复杂环境下机器人集群协作提供了创新性解决方案。

  

在仓储物流和机场调度等领域,多机器人路径规划(MRPF)长期面临"维度灾难"与协作效率低下的双重挑战。传统强化学习方法难以应对动态环境中机器人间的自适应交互,而现有深度强化学习(DRL)方案多采用结果驱动的协作模式,存在全局优化不足的缺陷。针对这一瓶颈,昆明理工大学的研究团队创新性地将群体意识概念引入DRL框架,开发出MACCRPF这一双层协同规划系统。

研究团队采用三项核心技术:1)基于群体意识的过程驱动协作框架,2)融合实时信息共享(基础层)与全局策略评估(顶层)的双层机制,3)平衡个体任务与系统目标的分层奖励设计。实验验证采用对比分析法,样本队列包含不同机器人密度的测试场景。

【Related work】系统梳理了MRPF领域两大主流框架——分布式训练与执行(DTDE)和集中训练分布式执行(CTDE)的演进脉络,指出现有方法在复杂环境适应性上的局限性。

【Methodology】创新设计的MACCRPF框架(图示2)包含:基础层群体共识实现机器人间的实时状态同步与局部调度,顶层群体共识通过策略评估模块动态调整全局路径规划。分层奖励机制设置个体任务奖励与系统协同奖励的动态权重。

【Experiments】在动态障碍物环境中,MACCRPF路径成功率较基准方法提升超20%,且在机器人数量倍增时保持稳定性能。转移实验表明,该框架在仓库、机场等不同场景均具良好泛化能力。

【Conclusion】该研究突破传统DRL在MRPF领域的应用瓶颈,通过群体意识驱动的过程协作机制,有效解决了高维状态下的协同决策难题。其创新性体现在:1)首次将群体意识分层建模引入DRL框架;2)开发出兼顾实时响应与全局优化的奖励机制;3)验证了框架在复杂场景下的强鲁棒性。这项成果为智能物流、灾害救援等需要多机器人协作的领域提供了关键技术路径,被《Engineering Applications of Artificial Intelligence》收录发表。研究获中国国家自然科学基金(62263017)和云南省基础研究计划(202301AU070059)资助,作者团队声明无利益冲突。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号