基于去个性化特征处理的统计异构环境下个性化联邦学习协同优化研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月28日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　针对联邦学习(FL)中统计异构性导致的全局模型适配性差问题，研究者提出HD-pFL框架，通过生成模型构建去个性化特征向量，协同训练共享全局模型与个性化分类器。实验证明该方法在CIFAR-10等数据集上显著提升模型泛化能力与个性化性能，为医疗等多中心数据协作提供新范式。

在人工智能与医疗健康深度融合的背景下，联邦学习(Federated Learning, FL)因其隐私保护特性成为多中心数据协作的热门技术。然而现实场景中普遍存在的统计异构性(Statistical Heterogeneity)导致各客户端数据分布差异显著，传统FL方法如FedAvg训练的全局模型难以适配所有客户端，严重制约模型性能。更棘手的是，当客户端上传过多个性化信息时，全局模型会偏向特定数据分布，反而削弱对其他客户端的辅助作用。这种"个性化悖论"成为制约FL落地医疗等关键领域的核心瓶颈。

针对这一挑战，中国研究人员创新性提出HD-pFL框架，其核心思想是通过生成模型重构本地特征，将原始特征与生成特征的差值作为"去个性化特征"参与全局训练。这种方法既保留了数据共性又过滤了特异性，使全局模型更具普适性。同时引入双模块结构：共享特征提取器保障基础泛化能力，个性化分类器专注本地适配。在CIFAR-10等三个数据集上的实验表明，该方法在Dirichlet分布(α=0.1)的极端异构场景下，平均准确率较FedRep提升12.7%，且展现出优异的公平性与鲁棒性。该成果发表于《Expert Systems with Applications》，为跨机构医疗影像分析等场景提供了理论支撑。

关键技术包括：(1)基于生成对抗网络的特征重构技术，通过φ_k生成器捕捉本地数据分布；(2)去个性化特征计算v_k^dep=v_k-φ_k(v_k)；(3)双阶段训练策略，交替更新共享模型θ^s与个性化模块θ_k^p；(4)采用EMNIST、CIFAR-10、SVHN三个标准数据集，按Dirichlet分布模拟不同异构程度。

研究结果部分显示：

个性化性能：在α=0.1的强异构设置下，HD-pFL在SVHN数据集达到82.3%准确率，显著优于FedProc(76.5%)和FedGH(74.1%)，证明去个性化特征能有效平衡全局共享与本地适配。
模块必要性分析：消融实验表明，同时使用去个性化特征和个性化分类器可使准确率提升19.2%，远超单一模块效果。
隐私保护评估：通过特征空间相似性度量，HD-pFL将原始数据泄露风险降低63%，因其不直接上传原始特征。

结论指出，HD-pFL首次从特征空间解耦的角度解决FL中的个性化悖论，其创新点在于：(1)提出可量化的去个性化特征处理流程；(2)建立全局-个性化双模块协同机制；(3)验证方法在医疗影像等敏感数据场景的适用性。讨论部分强调，该方法为FDA等机构倡导的"协作而不共享"医疗AI发展路线提供了技术实现路径，未来可拓展至跨模态联邦学习场景。需要指出的是，研究仍存在生成模型训练成本较高的问题，作者建议通过知识蒸馏技术进一步优化。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号