《IEEE Access》:A Three-Stage On-Device Machine Learning Pipeline for Service-Aware Power Optimization in 5G User Equipment
编辑推荐:
摘要:下一代无线通信技术(如5G)的发展使得超可靠低时延通信(Ultra-Reliable Low-Latency Communication, URLLC)和增强移动宽带(Enhanced Mobile Broadband, eMBB)资源得以利用。为提升用
摘要:下一代无线通信技术(如5G)的发展使得超可靠低时延通信(Ultra-Reliable Low-Latency Communication, URLLC)和增强移动宽带(Enhanced Mobile Broadband, eMBB)资源得以利用。为提升用户感知性能即体验质量(Quality of Experience, QoE),需依据应用特定需求合理分配网络资源给各应用,因此在用户设备(User Equipment, UE)层面进行智能资源管理日益必要。研究人员提出一种面向5G UE业务感知功耗优化的三阶段端侧机器学习(On-Device Machine Learning)流水线。该流水线由三部分组成:(1)流量分类器(Traffic Classifier,基于XGBoost),对实时(Real-Time, RT)/非实时(Non-Real-Time, NRT)流量进行实时二分类;(2)无数据预测器(NO-DATA Predictor,基于知识蒸馏Knowledge Distillation压缩得到的Student型逻辑回归Student-LogReg),预测NRT会话中的流量空闲(NO-DATA)区间;(3)有限状态机(Finite State Machine, FSM)控制器,在预测到NO-DATA概率P(NO-DATA) ≥ 0.80连续两个时隙时暂停分类器推理,当P(NO-DATA) < 0.60时在一个时隙内恢复。基于韩国KT 5G独立组网(Standalone, SA)商用网络流量的实验评估表明,该框架在保持QoE错误率0.26%、零重新分类(RECLASSIFY)事件的前提下,减少61.42%的分类器推理调用次数;预测器的DATA召回率(DATA Recall)达98.35%,有效防止分类器误分类。该方案为资源受限的端侧环境实现应用感知、高能效的网络管理提供了可行解决途径。为验证泛化性,流水线被植入自研Android测量应用,在六国(韩国、日本、澳大利亚、墨西哥、巴西、英国)七款三星Galaxy机型商用网络上实地测试,获得28组测量……
论文解读:《A Three-Stage On-Device Machine Learning Pipeline for Service-Aware Power Optimization in 5G User Equipment》(发表于IEEE Access)
一、研究背景与立题依据
随着5G用户数预计在2030年达63亿、5G流量占比升至80%,支持超可靠低时延通信(URLLC)与增强移动宽带(eMBB)的高需求服务(扩展现实XR、云游戏、超高清流媒体)使智能手机蜂窝通信模块功耗显著上升。用户设备(User Equipment, UE)为支持大带宽与多输入多输出(Multiple-Input Multiple-Output, MIMO)层持续激活射频(Radio Frequency, RF)电路,尤其当低吞吐量应用运行于高性能配置下时产生无意义能耗。传统端口(Port-based)与载荷(Payload-based / 深度包检测Deep Packet Inspection, DPI)流量分类法在加密普及后失效,基于统计特征的机器学习流量分类成为主流,但持续运行复杂分类模型本身也会带来端侧计算开销。3GPP连接态非连续接收(Connected-mode Discontinuous Reception, C-DRX)可在物理层令RF进入休眠,却未涉及上层机器学习推理层的能耗管理。现有研究多聚焦网络配置层节能或单独提升分类/预测精度,缺乏将流量分类、空闲区间预测与推理门控相结合且在多国商用5G网络实地验证的端侧方案。因此,研究人员提出一种三阶段端侧机器学习流水线,在保障QoE前提下大幅削减分类器推理调用以降低UE电流消耗。
二、主要关键技术方法
研究人员采用IEEE DataPort公开的韩国商用5G网络流量数据集(共328小时,含直播流、点播流、视频会议、在线游戏、云游戏等六类应用),按会话边界时序切分为训练集60%、验证集20%、测试集20%以防止时间泄露。特征提取选用包到达间隔时间(Inter-Arrival Time, IAT)、吞吐量(Throughput)、包长、方向比(Directional Ratio,上行UL/总量)及传输层协议分布(TCP/QUIC/UDP),均无需解密载荷。流量分类器选用XGBoost进行RT(实时:视频会议、云游戏、直播)/ NRT(非实时:点播流)二分类,以实时假负例(RT-FN,将RT误分为NRT)为首要最小化目标。NO-DATA预测器以教师—时态卷积网络(Temporal Convolutional Network, TCN)经知识蒸馏(Knowledge Distillation, KD)压缩为学生逻辑回归(Student-LogReg),输入长度W=20秒滑动窗口的NRT流量统计特征,二分类预测未来3秒内是否出现NO-DATA区间,以DATA FN(漏检数据到来)为首要抑制目标。有限状态机(Finite State Machine, FSM)控制器设定双阈值门控:连续两时隙P(NO-DATA) ≥ 0.80进入PAUSE挂起分类器(预测器持续运行),P(NO-DATA) < 0.60或连续三时隙检测到DATA则触发RECLASSIFY恢复RUN态。整套流水线以ONNX Runtime嵌入Android前台服务,在七款Samsung Galaxy终端、六国(含英国5G SA网)商用载波实地部署验证。
三、研究结果
SECTION I. Introduction(引言)
研究人员指出5G流量激增致网络拥塞与UE发热,传统分类法失效,引出端侧ML流量分类必要性,阐明所提三阶段流水线(分类器+预测器+FSM控制器)基本构思,并归纳三点主要贡献:分层推理门控架构、知识蒸馏极轻量预测模型、以NRT-FP最小化为目标的业务感知FSM。
SECTION II. Related Work(相关工作)
梳理5G/6G中eMBB与URLLC并存、C-DRX与UE辅助信息(UE Assistance Information, UAI)省电机制、端口/DPI分类局限及ML/DL(XGBoost、RNN/LSTM)流量分类进展、知识蒸馏等TinyML压缩手段,以及基于ARIMA/TCN的流量预测与C-DRX定时器优化研究,指出现有工作未同时实现ML推理层调用削减、QoE量化评估及多国实机验证。
SECTION III. System Architecture and Dataset(系统架构与数据集)
系统由Traffic Classifier(XGBoost,RT/NRT二分类)、NO-DATA Predictor(Student-LogReg via KD,仅作用于NRT时隙)及FSM Controller(PAUSE/RESUME/RECLASSIFY)构成。数据集来自韩国运营商采集的六类应用流量,按会话做时间顺序切分防泄露,NO-DATA与DATA类别不平衡用1:2.06类权重平衡。特征选取IAT、下行(Downlink, DL)比特率、包长、方向比、协议分布,均可从加密流时间戳提取。
SECTION IV. System Implementation and Testing(系统实现与测试)
—Traffic Classifier:对比XGBoost、LightGBM、HistGB、Random Forest,XGBoost在RT-FN最低可接受基础上NRT-FP(将NRT误分为RT致过早退出PAUSE)最少且ROC-AUC最优,选为最终分类器(测试集准确率≈96.9%)。
—Traffic Predictor:对比LogReg、Student-LogReg(KD)、多层感知机(Multilayer Perceptron, MLP)、TCN,搜索滑动窗口W∈{5,10,15,20,25}s;W=20 s时Student-LogReg(KD) DATA Recall=98.35%、DATA FN=13为最优,模型仅7.1 KB。
—FSM Controller:仿真显示Student-LogReg(KD)方案分类器调用削减61.42%,QoE错误率0.26%,RECLASSIFY事件0次;优于固定跳窗(Fixed-Window-Skip,错率5.77%)且仅略低于Oracle上界(92.62%),证明门控策略在节能与QoE间取得Pareto优势。
SECTION V. On-Device Validation(端侧验证)
定制Android测量应用(minSdk 26, targetSdk 34, ONNX Runtime 1.17.0)在七款Galaxy机型、六国(韩/日/澳/墨/巴/英,含英国EE的5G SA)八家运营商商用网执行29场次测试。分类器均值推理延迟0.75 ms、预测器0.88 ms,模型总占398.8 KB。所有场次RECLASSIFY=0;NRT应用(YouTube/Netflix)平均分类器调用削减46.1%,RT应用(YouTube Live/Zoom)平均33.2%;LG U+网YouTube达60.4%(与仿真基准61.42%相差1.02百分点),英国5G SA网下YouTube 48.5%、Netflix 45.7%、YouTube Live 50.7%,证实方案跨无线接入技术(Radio Access Technology, RAT)与跨国商用网泛化能力。
SECTION VI. Conclusion and Future Work(结论与展望)
研究人员得出结论:所提三阶段端侧ML流水线在真实5G NSA/SA商用网中以零RECLASSIFY事件、QoE错误率0.26%实现分类器推理调用削减61.42%(实地NRT均值46.1%),其载波无关设计依赖流量统计量故具跨国泛化性。局限含通过Android BatteryManager API测电流(待Monsoon等硬件级计量)、5G SA样本偏少、FSM参数未按业务自适应调优。未来拟开展硬件电流仪直接测量、扩大5G SA重训评测、基于强化学习(Reinforcement Learning, RL)的自适应FSM控制器。
四、研究结论(翻译结论核心内容)
本研究提出并验证了面向5G用户设备业务感知功耗优化的三阶段端侧机器学习流水线,含流量分类器(XGBoost)、NO-DATA预测器(经知识蒸馏的学生逻辑回归)及有限状态机控制器。该流水线在保持QoE错误率0.26%与零RECLASSIFY事件的同时减少61.42%的分类器推理调用。61.42%的削减源于预测器可提前20秒预判NO-DATA时段以实现 preemptive PAUSE;0.26% QoE错误率得益于FSM的RECLASSIFY机制可在至多三个时隙内纠正RT误分为NRT的情形;跨国泛化性来自FSM与载波参数无关的纯流量统计设计。实地部署于定制Android测量应用在七款三星Galaxy机型、六国商用5G NSA与SA网络,28场测试RECLASSIFY均为0,削减率19.6%~60.4%(LG U+/YouTube 60.4%,与仿真基准差1.02百分点),NRT应用均值46.1%高于RT应用33.2%(差12.9百分点),验证了方案在多国异质载波下的稳定性。