多无人机协同无线供能与数据采集：基于多智能体深度Q学习与遗传算法的优化策略

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月20日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　本文创新性地提出MA-DQL with GA（多智能体深度Q学习结合遗传算法）框架，通过联合优化多无人机(UAV)轨迹、发射功率和波束成形(beam-forming)，显著降低无线传感器网络(WSN)中最大任务完成时间。研究对比传统K-means聚类+蚁群优化(ACO)的基准方法(BM)，证明该算法在能量效率、时间公平性上的优越性，为动态环境下的无人机群协同提供新思路。

亮点节选

系统模型

本研究构建了一个多无人机(UAV)辅助的无线供能-数据采集网络场景，包含U架UAV、S个传感器节点(SN)和C个阵列天线。每架无人机u∈U={1,2,...,U}以最大速度V_max飞行，通过8×8子阵列天线同时为SNs充电并收集数据。

最小飞行时间基准算法

采用K-means聚类将SNs分组，通过交替优化技术将主问题拆分为两个子问题：1) 使用蚁群优化(ACO)计算无人机悬停位置；2) 采用凸优化工具(CVX)求解功率分配。该方法为后续MA-DQL算法提供性能对比基线。

问题重构

将连续空间量化为X×Y网格世界，时间离散化为δ时间槽。通过定义状态空间(X×Y)和动作空间(N_u=δ?T_u/δ?)，将原始优化问题转化为适合深度强化学习的马尔可夫决策过程。

仿真结果

在1km×1km区域内随机部署SNs的测试中，MA-DQL with GA展现出显著优势：相比基准方法，任务完成时间缩短37%，能量效率提升28%，且通过遗传算法的交叉变异操作增强了经验回放机制的探索效率。

结论

本研究证实，融合遗传算法的多智能体深度Q学习能有效解决多无人机在WPT环境中的协同优化问题。该方法通过演化完整决策轨迹，突破了传统DRL随机探索的效率瓶颈，为大规模物联网设备维护提供了创新解决方案。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号