多无人机协同无线供能与数据采集:基于多智能体深度Q学习与遗传算法的优化策略

【字体: 时间:2025年08月20日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文创新性地提出MA-DQL with GA(多智能体深度Q学习结合遗传算法)框架,通过联合优化多无人机(UAV)轨迹、发射功率和波束成形(beam-forming),显著降低无线传感器网络(WSN)中最大任务完成时间。研究对比传统K-means聚类+蚁群优化(ACO)的基准方法(BM),证明该算法在能量效率、时间公平性上的优越性,为动态环境下的无人机群协同提供新思路。

  

亮点节选

系统模型

本研究构建了一个多无人机(UAV)辅助的无线供能-数据采集网络场景,包含U架UAV、S个传感器节点(SN)和C个阵列天线。每架无人机u∈U={1,2,...,U}以最大速度Vmax飞行,通过8×8子阵列天线同时为SNs充电并收集数据。

最小飞行时间基准算法

采用K-means聚类将SNs分组,通过交替优化技术将主问题拆分为两个子问题:1) 使用蚁群优化(ACO)计算无人机悬停位置;2) 采用凸优化工具(CVX)求解功率分配。该方法为后续MA-DQL算法提供性能对比基线。

问题重构

将连续空间量化为X×Y网格世界,时间离散化为δ时间槽。通过定义状态空间(X×Y)和动作空间(Nu=δ?Tu/δ?),将原始优化问题转化为适合深度强化学习的马尔可夫决策过程。

仿真结果

在1km×1km区域内随机部署SNs的测试中,MA-DQL with GA展现出显著优势:相比基准方法,任务完成时间缩短37%,能量效率提升28%,且通过遗传算法的交叉变异操作增强了经验回放机制的探索效率。

结论

本研究证实,融合遗传算法的多智能体深度Q学习能有效解决多无人机在WPT环境中的协同优化问题。该方法通过演化完整决策轨迹,突破了传统DRL随机探索的效率瓶颈,为大规模物联网设备维护提供了创新解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号