
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多无人机协同无线供能与数据采集:基于多智能体深度Q学习与遗传算法的优化策略
【字体: 大 中 小 】 时间:2025年08月20日 来源:Expert Systems with Applications 7.5
编辑推荐:
本文创新性地提出MA-DQL with GA(多智能体深度Q学习结合遗传算法)框架,通过联合优化多无人机(UAV)轨迹、发射功率和波束成形(beam-forming),显著降低无线传感器网络(WSN)中最大任务完成时间。研究对比传统K-means聚类+蚁群优化(ACO)的基准方法(BM),证明该算法在能量效率、时间公平性上的优越性,为动态环境下的无人机群协同提供新思路。
亮点节选
系统模型
本研究构建了一个多无人机(UAV)辅助的无线供能-数据采集网络场景,包含U架UAV、S个传感器节点(SN)和C个阵列天线。每架无人机u∈U={1,2,...,U}以最大速度Vmax飞行,通过8×8子阵列天线同时为SNs充电并收集数据。
最小飞行时间基准算法
采用K-means聚类将SNs分组,通过交替优化技术将主问题拆分为两个子问题:1) 使用蚁群优化(ACO)计算无人机悬停位置;2) 采用凸优化工具(CVX)求解功率分配。该方法为后续MA-DQL算法提供性能对比基线。
问题重构
将连续空间量化为X×Y网格世界,时间离散化为δ时间槽。通过定义状态空间(X×Y)和动作空间(Nu=δ?Tu/δ?),将原始优化问题转化为适合深度强化学习的马尔可夫决策过程。
仿真结果
在1km×1km区域内随机部署SNs的测试中,MA-DQL with GA展现出显著优势:相比基准方法,任务完成时间缩短37%,能量效率提升28%,且通过遗传算法的交叉变异操作增强了经验回放机制的探索效率。
结论
本研究证实,融合遗传算法的多智能体深度Q学习能有效解决多无人机在WPT环境中的协同优化问题。该方法通过演化完整决策轨迹,突破了传统DRL随机探索的效率瓶颈,为大规模物联网设备维护提供了创新解决方案。
生物通微信公众号
知名企业招聘