PFL-GAN:生成式对抗网络赋能个性化联邦学习应对客户端异构性挑战

《IEEE Transactions on Machine Learning in Communications and Networking》:PFL-GAN: Client Heterogeneity Meets Generative Models in Personalized Federated Learning

【字体: 时间:2025年12月11日 来源:IEEE Transactions on Machine Learning in Communications and Networking

编辑推荐:

  本文针对联邦学习(FL)中客户端数据异构性(包括标签偏移、特征空间差异和拜占庭客户端)的难题,提出了一种基于生成式对抗网络(GAN)的个性化联邦学习框架PFL-GAN。该研究通过自动编码器(AE)引导的客户端相似性度量与截断径向基函数(RBF)核加权聚合策略,在服务器端安全地融合相似客户端的生成数据分布,为每个客户端训练个性化的生成模型。实验结果表明,PFL-GAN在MNIST、FMNIST和EMNIST数据集上的分类准确率显著优于FedAvg、FedProx等现有方法,最高可达97.11%,为解决非独立同分布(non-IID)数据下的模型个性化问题提供了有效方案,对边缘计算和物联网等应用场景具有重要价值。

  
在人工智能浪潮席卷各行各业的今天,如何让机器学习模型在保护用户隐私的前提下高效地从分散数据中学习,已成为制约技术落地的关键瓶颈。联邦学习(FL)应运而生,它允许各个客户端在本地训练模型,仅将模型参数上传至服务器进行聚合,有效避免了原始数据泄露的风险。然而,现实世界中的数据往往呈现出复杂的异构性——不同用户设备产生的数据不仅在标签分布上存在偏差(如医疗数据中某些疾病案例的稀缺),更在特征空间上表现出显著差异(如不同品牌手机拍摄的图片具有不同的色彩特征)。这种非独立同分布(non-IID)的数据特性使得传统联邦学习方法(如FedAvg)训练出的全局模型在个性化应用场景中表现不佳。
更棘手的是,现有研究多集中于处理标签分布倾斜问题,而对特征空间异构性(如图1所示的大写字母与手写小写字母虽属同一类别但特征迥异)和拜占庭客户端(即提供恶意或低质量数据的客户端)的挑战缺乏有效解决方案。当客户端数据源自完全不同领域(如部分客户端使用MNIST手写数字数据集,另一部分使用FMNIST服装图像数据集)时,直接进行模型平均聚合甚至会导致性能严重下降。生成式对抗网络(GAN)因其能够学习数据分布并生成逼真合成样本的能力,为这一难题提供了新思路。但如何在不暴露原始数据的前提下,精准衡量客户端间的数据分布相似度,并实现生成模型的个性化适配,仍是悬而未决的挑战。
针对上述问题,加州大学戴维斯分校和路易斯安那大学拉斐特分校的研究团队在《IEEE Transactions on Machine Learning in Communications and Networking》上发表了题为“PFL-GAN: Client Heterogeneity Meets Generative Models in Personalized Federated Learning”的研究论文。该研究创新性地提出了PFL-GAN框架,通过一种自动编码器(AE)引导的客户端相似性度量机制,巧妙地将生成式模型与个性化联邦学习相结合,在三大典型异构场景(标签倾斜、拜占庭客户端、异构特征空间)中均实现了显著优于现有方法的性能。
研究团队为开展此项工作,主要采用了以下几项关键技术方法:首先,每个客户端利用本地数据训练一个条件生成式对抗网络(cGAN),生成器(Gu)和判别器(Du)的参数被上传至服务器;其次,服务器使用预训练的自动编码器(AE)将各客户端生成的合成数据集映射为低维潜在表征,通过计算其概率分布的Kullback-Leibler散度(KLD)来量化客户端间相似性;接着,基于截断径向基函数(RBF)核(以平均距离τ为阈值)动态确定每个客户端应从其他相似客户端生成的合成数据中抽取的样本比例,从而为每个客户端构建个性化的训练数据集(Tui);最后,服务器利用该个性化数据集为每个客户端训练新的生成式对抗网络模型(Ggi和Dgi),并将其下发至相应客户端用于增强其本地下游任务(如图像分类)模型的训练。整个流程仅需一轮上行和下行通信,显著降低了带宽消耗。
I. 场景一:标签分布倾斜下的性能验证
在20个客户端均使用MNIST或FMNIST数据集的传统非独立同分布设置中,PFL-GAN生成的客户端相似性矩阵(图3)显示距离范围较窄,印证了此类数据分割的挑战性有限。然而,即使在此类“近乎独立同分布”的场景下,PFL-GAN在MNIST和FMNIST分类任务上的准确率分别达到97.11%和91.53%,仍优于FedBN(97.01%和90.68%)等对比方法,证明了其基础有效性。
II. 场景二:拜占庭客户端存在的极端异构环境
当10个客户端使用MNIST数据集、另外10个使用完全不同的FMNIST数据集时,相似性矩阵(图4)清晰地显示出组内距离小、组间距离大的分化现象。PFL-GAN通过精准聚类,使MNIST客户端和FMNIST客户端分别从同构数据中获益,其分类准确率(96.91%和84.34%)远高于FedOptim(81.96%和69.38%),凸显了其应对极端数据异构的强大能力。
III. 场景三:同标签空间下的特征空间异构
在EMNIST数据集的字母识别任务中,5个客户端使用大写字母数据集,5个使用小写字母数据集。虽然相似性矩阵(表3)显示距离范围相对较小(因部分字母特征相似),但PFL-GAN仍能有效区分客户端组别,其分类准确率逼近在完整训练集上训练的基线模型(98.05%和92.05%),显著优于其他联邦学习方法,证明了其对特征空间异构的适应性。
IV. 阈值选择与参数敏感性分析
距离阈值τ的选择直接影响个性化程度。研究对比了基于均值τ的硬阈值与K-Means聚类确定的软阈值?τ的性能,发现两者效果相近(如场景一准确率96.2% vs 97.11%)。对RBF核宽度σ的敏感性分析表明,使用计算得到的σ值能获得最佳性能(97.11%),过高或过低的σ会因引入噪声或限制关联范围而降低准确率。
V. 潜在维度对客户端区分度的影响
潜在表征维度对相似性度量的精确性至关重要。实验表明,当潜在维度从64提升至256时,模型对不同数据集客户端(如MNIST与FMNIST)的区分能力显著增强(图4、7、8),高维空间更能捕捉细微的特征分布差异。
VI. 带宽效率优势
与传统联邦学习需多轮迭代(如FedAvg需100轮)相比,PFL-GAN仅需一轮通信(上行11.47MB,下行11.47MB)即可完成个性化模型分发,总带宽消耗(22.94MB)远低于传统方法(804MB),在带宽受限的物联网环境中优势明显。
研究表明,PFL-GAN框架的核心优势在于其通过生成式模型安全地捕获了客户端的底层数据分布特征,并利用可量化的相似性度量实现了精准的个性化聚合。理论分析证明了该框架下生成式对抗网络模型的收敛性,确保生成器能够学习到相似客户端组合的数据分布。该方法不仅克服了传统非独立同分布数据下的模型漂移问题,更突破了以往个性化联邦学习对标签分布倾斜的局限,为处理多模态、跨领域的客户端数据异构提供了通用解决方案。
尽管当前实验在20个客户端规模上验证了有效性,但面对更大规模网络时,服务器需训练大量生成式对抗网络模型可能带来资源分配与延迟挑战。未来研究可探索客户端分组共享生成式对抗网络模型、小样本生成式对抗网络训练优化以及多模态数据适配等方向。该工作为构建更加智能、隐私安全且适应现实世界复杂数据环境的分布式学习系统奠定了重要基础,对推动边缘智能、智慧医疗等领域的应用具有深远意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号