边缘计算辅助推理中的任务卸载与批量调度优化框架:精度与延迟的协同优化

【字体: 时间:2025年07月28日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  针对边缘计算环境下资源受限设备产生的实时推理任务,研究人员提出了一种结合近似计算(AxC)的任务卸载与批量调度框架。该研究通过联合优化任务压缩比和卸载策略,在GPU加速的边缘服务器上实现并行批处理,平衡推理精度与端到端延迟。采用半定松弛(SDR)和随机映射算法,将NP难问题分解为压缩优化和卸载决策两个子问题迭代求解。实验表明该框架可降低50%总成本,为边缘智能(Edge Intelligence)应用提供高效解决方案。

  

随着物联网(IoT)设备和增强现实(AR)/虚拟现实(VR)等应用的普及,资源受限设备产生的实时推理任务面临严峻挑战。这些设备往往受限于计算能力和电池续航,而现代应用又要求毫秒级响应和高精度推理。边缘计算(Edge Computing)虽能通过任务卸载(Task Offloading)缓解该矛盾,但传统方案在传输延迟、批量处理效率和推理精度之间存在难以调和的冲突。特别是在采用近似计算(Approximate Computing, AxC)范式时,任务压缩虽减少传输时间却降低推理质量,形成典型的"精度-延迟"权衡困境。

希腊国家技术大学(National Technical University of Athens, NTUA)的Dimitrios Spatharakis团队在《Future Generation Computer Systems》发表研究,提出创新性解决方案。该工作构建两层次系统模型:边缘设备(EDs)可选择本地快速低精度推理,或将压缩后任务卸载至配备GPU的边缘云(ECs)进行高精度批处理。通过建立加权目标函数,将联合优化问题分解为压缩比优化和卸载决策两个子问题,采用半定松弛(Semidefinite Relaxation, SDR)和随机映射算法实现多项式时间求解。实验基于YOLO目标检测框架,在Intel NUC硬件平台上验证了框架有效性。

关键技术包括:(1)建立包含传输、解码、推理的端到端延迟模型;(2)推导任务同时到达边缘云时的批处理最优条件;(3)将混合整数规划转化为二次约束二次规划(QCQP)问题;(4)设计交替迭代算法求解压缩比和二进制卸载决策。研究使用真实硬件参数模拟,压缩比优化采用线性函数逼近,卸载策略通过SDR松弛和随机舍入实现。

【系统模型和问题构建】
研究设定包含N个同构边缘设备(EDs)和M个边缘云(ECs)的双层架构。每个任务包含大小不超过dmax的图像数据,本地处理采用轻量级模型,远程处理采用精确模型。关键变量包括二进制卸载决策xi∈{0,1}和压缩比αi∈(0,1],目标函数联合优化平均精度和延迟:min λTavg - (1-λ)Aavg,其中λ∈[0,1]为权衡参数。

【精度最大化与SDR松弛】
压缩子问题的解析解揭示:当所有卸载任务同时到达EC时,批处理延迟最小化。卸载决策问题通过SDR将二元约束转化为矩阵秩约束,再通过随机映射获得可行解。实验显示该方法在多项式复杂度内接近最优解,尤其在大规模任务场景下优势显著。

【数值验证】
基于YOLO和Intel NUC平台的实验表明:当任务数N=100时,本框架总成本比基准方法降低50%以上。参数敏感性分析显示,权衡参数λ=0.6时能实现最佳精度-延迟平衡,而GPU批处理规模扩大使收益呈超线性增长。

该研究创新性地将AxC原则引入边缘智能场景,通过数学建模揭示了任务同步到达对批处理优化的关键作用。提出的SDR-based算法为NP难问题提供了实用解决方案,其50%的性能提升为AR/VR、智能城市等实时应用奠定基础。未来工作可扩展至异构设备环境和多目标优化场景,推动边缘计算范式在5G/6G时代的广泛应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号