基于边缘处理与双Q学习强化学习的物联网任务分配优化及其多目标性能提升

【字体: 时间:2025年09月17日 来源:Intelligent Systems with Applications 4.3

编辑推荐:

  为解决物联网(IoT)动态异构环境中任务分配存在的单目标优化、决策值高估及学习不稳定等问题,研究人员开展了一项基于Double Q-learning算法与多目标奖励函数的边缘计算任务卸载策略研究。结果表明,该方法显著降低了任务执行延迟(23%)、节点能耗(18%),并改善了负载均衡(27%),为智能边缘系统的资源优化提供了新思路。

  

随着物联网(IoT)设备的爆炸式增长和实时计算需求的激增,如何在海量设备与有限资源间实现高效任务分配已成为边缘计算领域的核心挑战。传统方法往往陷入"单目标优化"的陷阱——要么只追求低延迟,要么只顾节能,却难以在动态变化的真实环境中实现多维度平衡。更令人头疼的是,主流深度强化学习(DRL)方法存在严重的Q值过高估计问题,导致决策波动大、稳定性差,就像让一个容易冲动的司机在复杂路况中同时控制车速、油耗和载重分配,难免顾此失彼。

在这项发表于《Intelligent Systems with Applications》的研究中,来自伊朗伊斯兰阿扎德大学大不里士分校的Mohsen Latifi团队交出了一份富有创意的解决方案。他们巧妙地将双Q学习(Double Q-learning)算法与多目标奖励函数相结合,设计出一种能同时优化延迟、能耗和负载均衡的智能任务分配框架。这项研究不仅解决了传统方法的局限性,更在动态环境中实现了23%的延迟降低、18%的能耗节约和27%的负载均衡提升,为边缘计算领域树立了新的性能标杆。

研究团队采用了几项关键技术方法:首先建立了基于马尔可夫决策过程(MDP)的环境模型,将任务大小、节点剩余能量、计算能力、实时负载等参数纳入状态空间;其次设计了双Q学习算法框架,通过两个独立的价值估计器(Q1和Q2)分离动作选择与评估过程,有效降低了传统Q学习中的过高估计偏差;最后构建了多目标奖励函数,将任务执行延迟、能量消耗和计算负载平衡三个关键指标通过加权系数(α, β, γ)进行联合优化。所有实验均基于包含10000条记录的模拟数据集(IoT_Task_Offloading_Dataset)进行验证。

3.1. 强化学习算法环境设置

研究人员将任务卸载问题建模为马尔可夫决策过程(MDP),状态空间包含任务大小、截止时间、节点剩余能量、当前工作负载等关键参数,动作空间为所有可用边缘节点的集合。奖励函数采用加权组合形式:Rt = -(ω1·Dt + ω2·Et + ω3·Lt),其中Dt为延迟,Et为能耗,Lt为负载指标。

3.1.2. 参数选择策略

通过经验调优确定了关键参数:学习率αL=0.05,折扣因子γ=0.95,探索率ε=0.2。奖励权重分别设置为α=0.4(延迟)、β=0.3(能量)、γ=0.3(负载平衡),这些值在多次仿真运行中表现出稳定的收敛性能。

3.1.3. 双Q学习算法

该算法的核心创新在于使用两个独立的Q函数(Q1和Q2)交替进行动作选择和价值评估。更新公式为:Q1(s,a) → α[r + γQ2(s′,argmaxQ1(s′,a′)) - Q1(s,a)] + Q1(s,a),这种结构有效解耦了选择与评估过程,减少了过高估计偏差。

3.2.4. 学习决策策略

通过5000个训练周期,智能体逐渐学习到最优策略π,该策略基于双Q函数的平均值选择动作:π(s) = argmaxa(Q1(s,a) + Q2(s,a))。策略执行阶段,节点根据当前状态(能量水平、处理队列、网络负载等)动态决定在本地处理、发送至边缘节点或传输到中央服务器。

4. 评估与比较

在仿真环境中,该方法在多个维度显著优于对比算法(DROA和DRL-TS)。在节点数量增加至100个的高负载场景下,平均任务延迟降低至147ms,而Q-learning和DQN分别达到193ms和182ms。能量消耗方面, proposed method仅需0.76J,比基准方法降低18%。负载均衡指数达到82%,改善幅度达27%。统计检验显示所有改进均具有高度显著性(p < 0.001)。

研究结论表明,这种基于双Q学习的多目标优化框架成功解决了物联网边缘环境中的任务分配难题。其重要意义在于:第一,通过双估计器结构有效克服了强化学习中的过高估计问题,提高了决策稳定性;第二,多目标奖励函数的设计实现了延迟、能耗和负载之间的最佳权衡,更符合实际应用需求;第三,该方法在动态环境中展现出良好的适应性和可扩展性,为未来智能边缘系统的发展提供了重要技术支撑。尽管当前研究基于仿真数据,但团队已规划将框架扩展至联邦强化学习和多智能体系统,以应对更复杂的实际部署场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号