基于深度强化学习的无人机-无人车双向通信路由框架优化研究

【字体: 时间:2025年07月01日 来源:Cognitive Robotics CS8.4

编辑推荐:

  为解决无人机(UAV)与无人车(UGV)协同网络中传统路由协议适应性差、能效低的问题,研究人员提出了一种融合贪婪周边无状态路由(GPSR)与深度强化学习(DRL)的智能路由框架。该协议通过动态调整路由决策和Hello包间隔,显著提升了网络吞吐量、降低了延迟与丢包率,为军事侦察、灾害救援等任务关键型应用提供了鲁棒通信支持。

  

在军事侦察、灾害救援等复杂场景中,无人机(UAV)与无人车(UGV)的协同作业需要高效稳定的双向通信支持。然而,传统路由协议如贪婪周边无状态路由(GPSR)存在明显局限:仅适用于单一平台组网,难以适应跨UAV-UGV的动态拓扑变化;依赖固定参数导致能效低下;且易因节点移动性产生路由空洞。这些问题严重制约了异构无人系统在任务关键型场景中的应用效能。

为突破这些技术瓶颈,研究人员创新性地将深度强化学习(DRL)与GPSR协议深度融合,开发出具有环境感知能力的智能路由框架。该研究通过Python仿真验证表明,新协议在数据包投递率(PDR)、延迟等核心指标上显著优于传统方案,特别是在大规模节点部署时优势更为突出。

研究团队采用三项关键技术方法构建系统:首先设计专用Hello包格式,集成节点类型(UAVi/UGVj)、剩余能量(RE)等关键参数;其次建立DRL状态空间模型,融合节点位置(xi,yi,zi)、移动矢量等动态特征;最后构建多目标奖励函数,平衡延迟(D)、能效(EE)与PDR的优化权重(α,β,γ)。

网络模型与方法部分揭示了协议的核心机制:

  • 邻居发现机制通过自适应Hello包间隔动态维护拓扑表,解决高移动性导致的链路不稳定问题
  • 位置预测模块利用DRL分析历史轨迹数据,提前规避可能出现的路由空洞
  • 混合转发策略在贪婪转发失效时自动切换周边路由模式,确保95%以上的连通性

实验结果显示:

  • 在12节点测试中,协议实现72%的PDR,最优路径仅需1跳(传统GPSR平均4-6跳)
  • 数据包规模增至25个时,网络吞吐量提升18%,最大延迟控制在5.25秒内
  • 百级节点规模下仍保持72.7%的PDR,验证了协议的强扩展性

讨论部分指出,DRL的引入使协议具备三大突破性优势:

  1. 实时学习能力:通过Q-learning动态调整路由策略,将拓扑变化响应时间缩短80%
  2. 能效优化:智能Hello包间隔机制降低控制开销,节点能耗减少23%
  3. 抗环设计:基于历史数据的死锁预测使路由环路发生率下降67%

该研究为异构无人系统通信提供了首个可扩展的AI驱动解决方案,其创新点在于:将GPSR的地理路由优势与DRL的环境适应能力有机结合,攻克了传统协议在三维空间组网的固有缺陷。成果不仅适用于战场侦察等军事场景,也为智能交通系统(ITS)中的空地协同提供了关键技术支撑。未来通过引入联邦学习等机制,可进一步强化协议在对抗环境中的生存能力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号