《IEEE Transactions on Communications》:Energy-Efficient Duplex Mode Optimization for Network-Assisted Full-Duplex Cell-Free Massive MIMO Systems
编辑推荐:
本文针对网络辅助全双工(NAFD)无蜂窝大规模多输入多输出(CF-mMIMO)系统的能效(EE)优化问题,提出了一种基于Q学习的智能双工模式优化算法。研究通过建立实际能耗模型,对比了NAFD与同频同时全双工(CCFD)系统的EE性能,并引入强化学习动态分配远程天线单元(RAU)的工作模式(上行/下行)。仿真结果表明,所提算法在保证用户服务质量(QoS)前提下,显著提升系统EE,为6G绿色通信提供了新思路。
随着5G/6G技术的快速发展,无线通信系统面临频谱资源紧张和能耗激增的双重挑战。无蜂窝大规模多输入多输出(Cell-Free Massive MIMO, CF-mMIMO)通过分布式部署大量远程天线单元(Remote Antenna Units, RAUs)打破传统蜂窝边界,显著提升频谱效率(Spectral Efficiency, SE)和覆盖能力。然而,传统同频同时全双工(Co-frequency Co-time Full Duplex, CCFD)技术虽能实现上下行同步传输,但其自干扰(Self-Interference, SI)问题严重,且干扰消除电路带来额外能耗,制约了系统能效(Energy Efficiency, EE)的提升。在此背景下,网络辅助全双工(Network-Assisted Full-Duplex, NAFD)架构应运而生——它利用半双工设备动态分配RAU的上下行模式,无需复杂自干扰消除,兼具频谱灵活性和能效潜力。但现有研究多聚焦于SE优化,缺乏对NAFD系统EE的系统性评估与动态优化方法。
为此,李亚琪等人在《IEEE Transactions on Communications》上发表论文,首次构建了NAFD系统的实际能耗模型,并创新性地提出基于Q学习的双工模式优化算法。研究通过量化比较NAFD与CCFD系统的EE性能,证实了NAFD在绿色通信中的优势;进一步利用强化学习智能调控RAU工作模式,在保证用户服务质量(Quality of Service, QoS)的前提下最大化EE,为动态无线环境下的资源分配提供了新范式。
本研究的关键技术方法包括:1. 建立涵盖电路功耗、线性处理、数据传输、回传链路及RAU间干扰消除(Inter-RAU Interference Cancellation)的NAFD系统能耗模型;2. 将RAU模式选择建模为马尔可夫决策过程,利用Q学习算法探索最优双工配置;3. 采用线性预编码(如最大比传输MRT、迫零ZF)和接收机组合(如最大比合并MRC)策略,结合信道估计误差和残余干扰分析,推导上下行信干噪比(SINR)与速率闭式表达式。
系统模型与能耗分析
研究团队构建了NAFD CF-mMIMO系统模型,其中M个RAUs均匀分布,服务K个单天线用户设备(User Equipments, UEs)。通过引入二元模式选择向量动态分配RAU的上下行模式,建立了包含 transceiver chain、线性处理、数据传输、回传链路和干扰消除的全面能耗模型。特别地,针对NAFD特有的RAU间干扰,提出了基于波束成形训练的干扰消除能耗项Pic,增强了模型的实用性。
NAFD与CCFD系统能效对比
仿真结果表明,在ZF预编码下,NAFD系统的EE显著优于C-RAN CCFD和集中式CCFD大规模MIMO系统。例如,在0.5累积分布函数(CDF)点,NAFD相较于C-RAN CCFD和CCFD大规模MIMO分别提升36.6%和54.8%的EE。这主要归因于NAFD无需自干扰消除(SIC)的能耗优势。此外,研究还发现EE随RAU天线数量N先增后降,存在最优天线配置点(Mopt≈7),过量天线会因硬件功耗抵消SE增益。
基于Q学习的双工模式优化算法
针对RAU模式优化问题,研究将CPU作为智能体(Agent),RAU模式作为状态(State),模式切换作为动作(Action),系统EE作为奖励(Reward),构建Q学习框架。采用线性衰减的ε-greedy策略平衡探索与利用,通过5000轮训练使Q表收敛。算法复杂度仅与训练次数线性相关,远低于穷举法(O(2M)),且优化后的策略可离线部署,实现实时快速决策。
智能双工方案性能验证
所提Smart Duplex方案在EE性能上显著优于平均分配、随机分配、TDD等固定模式策略。在M=8时,其EE较平均RAU方案提升76.08%,且接近穷举法最优解(差距仅13.22%)。同时,该方案在动态环境中表现出良好适应性:当RAU数量增加时,其EE增益相较于Greedy算法进一步扩大,凸显了强化学习在复杂配置下的优势。
本研究通过理论建模与算法创新,系统揭示了NAFD架构在能效方面的巨大潜力。所构建的精细化能耗模型为后续绿色通信研究提供了基准工具,而基于Q学习的智能双工优化算法则突破了传统优化方法的高复杂度瓶颈。研究成果不仅证实了NAFD在EE方面相对CCFD的显著优势,更通过数据驱动方法实现了动态环境下的自适应资源分配,为6G网络“节能与高效并存”的目标提供了关键技术支撑。未来工作可进一步探索多智能体强化学习、跨层优化等方向,以应对超密集网络下的复杂干扰管理挑战。