SemCom-OPTIMA:异构边缘云系统中语义图像传输的实证驱动优化框架

《IEEE Open Journal of the Computer Society》:SemCom-OPTIMA: Empirically-Driven Optimization of Semantic Image Transmission across Heterogeneous Edge-Cloud Systems

【字体: 时间:2025年12月12日 来源:IEEE Open Journal of the Computer Society 8.2

编辑推荐:

  本文针对多用户多边缘环境下语义通信(SemCom)部署存在的计算能力差异、通信资源分配不均及语义编解码器不匹配等问题,提出SemCom-OPTIMA优化框架。研究通过联合优化用户-边缘关联、语义掩码比率、CPU频率缩放及功率-带宽分配,在严格延迟与能量约束下最大化语义图像重建精度。实验表明,该框架在10用户3边缘测试床上较基线方法提升峰值信噪比(PSNR)10-12%,显著提升6G网络语义通信效率。

  
随着扩展现实、数字孪生和自动驾驶等复杂技术的普及,传统遵循香农-韦弗模型(Shannon-Weaver model)的通信框架面临严峻挑战。该模型专注于数据的精确传输而非内容理解,导致传输延迟高、资源浪费严重,难以满足第六代移动通信(6G)应用对人工智能(AI)赋能的智能化通信需求。语义通信(Semantic Communication, SemCom)应运而生,其核心思想是让通信节点智能地交换数据中有意义的部分,而非盲目传输所有信息。尽管语义通信在提升效率方面潜力巨大,但在多层级、异构的边缘-云系统中实际部署时,仍面临设备计算能力差异、通信资源波动以及用户编码器与边缘服务器解码器间语义不匹配等关键问题。
为解决这些挑战,本研究提出SemCom-OPTIMA框架,专门为多用户、多边缘环境下的语义图像传输提供全面优化。该框架旨在在严格的延迟和能量约束下,最大化图像重建精度。具体而言,研究将问题建模为一个混合整数非线性规划(Mixed-Integer Nonlinear Programming, MINLP)问题,综合考虑用户-边缘关联、语义掩码比率、CPU频率缩放以及联合功率-带宽分配等多个维度。鉴于问题的NP难复杂性,研究团队设计了一种多阶段分解算法,通过迭代求解语义-计算资源分配、信道资源管理和自适应用户-边缘关联等可处理的子问题,确保解的收敛性和可行性。
本研究的一个显著特点是其坚实的实证基础。团队进行了大规模的设计空间探索,涉及60万个样本,覆盖掩码比率(0-0.99)、信噪比(1-16 dB)以及多样化的图像类别(1000个ImageNet标签)。在一个真实的10用户、3边缘节点的测试平台上进行的实验表明,与现有先进基线方法相比,SemCom-OPTIMA能够持续实现10-12%更高的峰值信噪比(Peak Signal-to-Noise Ratio, PSNR),并鲁棒地满足能量和延迟约束。
研究采用的关键技术方法主要包括:1) 基于视觉Transformer的掩码自编码器(Vision Transformer-based Masked Autoencoder, ViT-MAE)用于语义提取和图像重建;2) 利用XGBoost机器学习模型根据掩码比率、信噪比(SNR)和图像标签预测重建精度(PSNR);3) 通过多阶段优化算法分解复杂的MINLP问题,依次求解资源分配和用户关联子问题;4) 在包含10个用户和3个边缘节点的异构网络测试床上进行性能验证。
系统模型与问题表述
系统考虑一个包含用户集合U和边缘节点集合N的无线网络。用户设备使用预训练的ViT-MAE编码器将图像转换为嵌入向量,每个边缘节点则拥有独立预训练的ViT-MAE解码器,导致其重建不同类别图像的精度存在差异,即存在语义异构性。图像传输过程包括本地编码、无线传输和边缘服务器重建三个阶段。优化目标函数(8a)是最大化系统总重建精度,约束条件包括总延迟不超过Tmax(8b)、单个用户总能耗不超过Eumax(8c)、以及边缘节点的带宽、发射功率和计算资源限制(8d-8f)等。
探索性分析
通过对ViT-MAE进行大量实证测试,研究发现重建精度(PSNR)与掩码比率(δun)负相关,与信噪比(SNRun)正相关,且不同图像标签(lu)的重建精度因边缘节点解码器而异。编码所需的浮点运算量(FLOPs)随掩码比率线性下降,而解码运算量基本保持恒定。基于60万样本数据训练的XGBoost模型能高精度预测PSNR(R2=0.9953),为优化问题提供了可计算的目标函数近似。
提出的解决方案
SemCom-OPTIMA算法采用分层优化策略。首先,在用户-边缘关联确定前,通过子问题(13)和(14)分别为所有可能的用户-边缘对分配语义-计算资源(掩码比率、CPU频率)和信道资源(带宽、功率),以最小化总掩码比率和最大化总SNR,同时满足延迟和能量约束。接着,通过子问题(15)进行用户-边缘关联,为每个用户选择能提供最高预测PSNR的边缘节点。关联确定后,算法进入边缘级循环,利用子问题(16)和(17)对已关联的用户-边缘对重新优化资源分配,充分利用释放的资源。算法最终收敛,其计算复杂度为O(K1M3 + K1M + K2|N||U|3),其中K1、K2为迭代次数,M为可能的用户-边缘对数量。
性能评估
在三个实验中,将SemCom-OPTIMA与三种基线方法(静态边缘-标签语义匹配关联、最短距离关联、随机关联)进行比较。实验一变化用户最大能量预算Emax,结果显示随着可用能量增加,系统平均PSNR提升,掩码比率降低,SNR升高,SemCom-OPTIMA性能始终最优。实验二变化最大延迟阈值Tmax,在能量约束宽松时,SemCom-OPTIMA仍能通过自适应关联获得最高PSNR,距离关联法则因语义匹配不足而表现较差。实验三假设所有边缘解码器同质,静态语义匹配关联方法因将所有用户关联至同一边缘导致资源过载而性能骤降,而SemCom-OPTIMA和随机关联法则因能均衡负载表现良好,凸显了SemCom-OPTIMA在异构和同质环境下的鲁棒性。
结论与讨论
SemCom-OPTIMA成功解决了异构边缘云网络中语义图像传输的联合优化问题。其创新之处在于将复杂的MINLP问题分解为可迭代求解的子问题,并基于大量实证数据驱动优化决策。框架显著提升了图像重建质量,同时保证了延迟和能量约束的满足。未来工作可探索强化学习(RL)策略以实现动态网络环境下的实时自适应,并将框架扩展至视频、LiDAR等多模态语义任务以及其他实用任务如分类、目标检测和视觉问答(VQA),进一步巩固其在实际应用中的价值。
本研究由卡塔尔国家研究基金(GSRA9-L-1-0519-22025)资助,相关成果发表于《IEEE Open Journal of the Computer Society》。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号