
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于合作博弈的分布式最优同步控制:离散时间多智能体系统中通过多步分布式值迭代实现
《IEEE Systems Journal》:Cooperative Game-Based Distributed Optimal Synchronization Control via Multistep Distributed Value Iteration in Discrete- Time Multiagent Systems
【字体: 大 中 小 】 时间:2025年11月21日 来源:IEEE Systems Journal 4.4
编辑推荐:
针对离散时间线性多智能体系统分布式协同博弈求解问题,提出基于模型的阶梯式DVI强化学习算法,有效平衡了DVI算法的收敛速度与DPI初始策略可容性要求,设计了通用稳定性准则并验证了算法有效性。
近年来,分布式协作博弈(DCGs)被广泛应用于解决分布式无领导共识控制[1]和分布式领导者-追随者最优跟踪控制[2]问题。DCGs已被用于解决一些现实世界的工业控制问题,例如多非完整移动机器人的围控问题、多轮式机器人的避碰问题以及多自主飞行器的编队控制问题。它们受到了学者们的广泛关注,已成为最重要的研究课题之一。DCGs主要涉及代数图论(通信图拓扑)、多智能体系统(MASs)、分布式共识控制理论(分布式领导者-追随者控制和分布式无领导共识控制)以及分布式学习算法(DRL和分布式自适应动态规划(DADP)算法)。代数图论用于以分布式方式研究协作博弈;MASs为DCGs提供了相应的载体或系统模型;分布式共识控制理论的应用使DCGs更加具体化;分布式学习算法可用于获得DCGs的分布式纳什均衡(NE)解。DCGs为解决分布式共识控制问题提供了一种方法,表明分布式共识控制问题可以表示为DCGs的形式。本文重点关注分布式共识控制中的分布式领导者-追随者同步控制问题,该问题要求所有追随者智能体的状态与领导者或参考智能体的状态保持同步。本文的目标是快速求解DCGs的全局纳什均衡,通常需要建立耦合的哈密顿-雅可比-贝尔曼(HJB)方程。
生物通微信公众号
知名企业招聘