
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于图扩散网络的无人机集群协同探索多智能体强化学习模型研究
【字体: 大 中 小 】 时间:2025年06月20日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对无人机集群在复杂环境中协同探索时存在的个体失效和通信不稳定问题,研究人员提出基于图扩散网络(GDN)的多智能体强化学习(MARL)模型。该模型通过链式扩散机制实现智能体状态的空间卷积,结合LSTM网络动态聚合邻域信息,显著提升集群在部分节点失效情况下的鲁棒性。实验证明,GDN在仿真和真实飞行平台(ROS2/PX4)中均能实现高效探索,为灾害救援、工程勘测等场景提供新范式。
无人机集群探索在灾害救援、工程勘测等领域具有重要应用价值,但传统集中式调度算法存在鲁棒性差、无法动态响应环境变化等问题。尽管自组织控制算法(如基于强化学习的方法)能部分解决这些问题,但现有研究往往假设集群成员始终稳定工作,忽略了大规模集群中个体失效对系统性能的影响。当部分无人机因硬件故障或通信中断无法执行任务时,传统算法可能导致全局任务失败。
为解决这一挑战,中国某研究机构团队在《Engineering Applications of Artificial Intelligence》发表研究,提出创新的图扩散网络(Graph Diffusion Network, GDN)。该模型将长短期记忆网络(LSTM)的时序卷积能力拓展至多智能体空间维度,通过链式扩散机制实现智能体状态的动态聚合。研究人员设计了包含失效节点的仿真环境,并基于ROS2和PX4搭建真实无人机平台验证算法有效性。
关键技术包括:1)构建链式信息扩散的图卷积架构,支持异构无人机集群的邻域状态聚合;2)设计自适应策略网络,动态屏蔽失效节点的影响;3)开发融合GDN的多智能体强化学习(MARL)框架;4)实现ROS2与PX4的硬件集成,完成物理飞行验证。
相关工作中
对比分析了深度Q网络(DQN)和深度图网络(DGN)的局限性,指出现有方法无法处理节点动态失效问题。GDN通过索引排序的链式传播机制,确保信息在正常节点间高效流动。
方法部分
提出无人机集群探索的网格世界模型,定义观测空间(如γ-信息地图)和动作空间。GDN核心采用LSTM单元处理邻域状态序列,生成包含拓扑关系的特征向量。物理平台采用4级正交幅度调制(4QAM)提升光学通信稳定性。
实验结果
仿真显示GDN在30%节点失效时仍保持85%探索效率,较DGN提升40%。真实飞行实验中,尽管搭载低分辨率相机,集群通过数量优势实现高质量图像采集,探索速度比传统方法快2.3倍。
结论与讨论
GDN的创新性体现在三方面:1)首次将LSTM时空卷积特性应用于多智能体空间关系建模;2)提出失效节点动态屏蔽机制,增强系统容错性;3)实现算法在边缘计算设备上的轻量化部署。该研究为无人机集群在GPS拒止环境下的协同作业提供新思路,未来可拓展至异构多机器人系统协同领域。
生物通微信公众号
知名企业招聘