FedFreeze：一种用于联邦学习的双阶段层冻结框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年11月26日 来源：Future Generation Computer Systems 6.2

编辑推荐：

　　提出FedFreeze框架，通过设备端和服务器端的双阶段层冻结策略，在联邦学习训练中平衡速度与精度。设备端采用基于正则化的冻结策略加速训练，服务器端通过收敛监测保证最终精度，实验表明其加速比最高达1.3倍，精度损失不超过1.67%。

　　
本文提出了一种名为FedFreeze的双阶段联邦学习层冻结框架，旨在解决现有层冻结方法在加速与精度之间的权衡难题。研究首先分析了联邦学习（FL）中设备端计算资源受限的痛点，指出传统层冻结方法存在两大矛盾：早期冻结导致精度损失，而后期冻结加速效果有限。通过结合设备端和服务器端的动态冻结策略，FedFreeze实现了更优的平衡。

### 核心创新点
1. **双阶段冻结机制**
- **设备端（Local Freezer）**：采用基于正则化的冻结策略，通过动态调整各层的训练迭代次数，在早期阶段冻结收敛速度快、计算冗余度高的底层。例如，在LeNet训练中，设备端可提前冻结前两层，减少78%的本地计算量。
- **服务器端（Global Freezer）**：基于梯度收敛性分析，在模型接近收敛时冻结剩余层。例如，在VGG11训练中，服务器端在迭代第181轮后冻结未收敛的深层，确保最终模型精度。

2. **正则化与迭代分配的关联**
研究发现，各层参数的梯度变化速率存在显著差异（如底层先收敛），但传统正则化方法通过统一惩罚系数难以适应这种动态。FedFreeze通过引入自适应迭代分配公式，将总迭代数按层需求动态拆分。例如，对高梯度变化的中间层分配更多迭代，而底层冻结后仅分配少量迭代，既加速训练又维持精度。

3. **收敛性监控与阈值优化**
服务器端通过计算梯度变化的指数移动平均（EMA）和梯度范数阈值，建立保守冻结规则。实验表明，该机制能提前识别稳定收敛的层（如ResNet12的底层在60轮后梯度变化低于阈值），相比ALF方法减少30%的迭代轮次。

### 实验验证与对比
研究在FMNIST、CIFAR-10和CIFAR-100三个数据集上，分别使用LeNet、VGG11和ResNet12进行测试，覆盖从轻量级到复杂残差网络的不同场景。实验平台包括Raspberry Pi集群（低算力）和Jetson Nano集群（中高算力），确保泛化性。

- **加速效果**：FedFreeze在FMNIST上实现1.3倍加速（从19480秒降至15031秒），在CIFAR-100上达到1.09倍加速，同时保持与原FL方法1.67%以内的精度损失。
- **对比基线**：
- **AutoFreeze**：早期冻结策略，但精度损失高达6.34%（VGG11随机初始化）。
- **ALF**：仅后期冻结，加速效果提升不足5%（如CIFAR-10上1.03倍）。
- **预训练迁移学习**：在CIFAR-100上精度损失达3.5%（ResNet12随机初始化），而FedFreeze通过动态冻结减少损失至0.89%。

### 技术实现关键
1. **设备端动态冻结算法**
设备端在本地训练初期（前5%）通过梯度范数历史数据计算各层自适应冻结阈值。例如，在FMNIST上，LeNet的C1层在5%迭代时梯度方差降至基准值的60%，触发冻结；而C2层因收敛较慢仍保留迭代机会。

2. **服务器端收敛性评估**
服务器端采用双指标评估层收敛性：梯度变化率（EMA）和梯度范数稳定性。例如，对ResNet12在CIFAR-100上的中间层（RB128），当EMA梯度变化连续5轮低于0.001且梯度范数波动小于初始值的15%时，触发冻结。

3. **硬件适配优化**
针对Raspberry Pi的ARM架构，通过调整冻结策略权重（μ值）减少内存占用；在Jetson Nano集群中，利用GPU并行计算加速梯度聚合，使服务器端冻结决策时间降低40%。

### 应用场景与优势
- **多模态数据兼容性**：在传感器数据集（如IMU步态识别）中，FedFreeze通过冻结低层卷积核（负责特征提取）实现训练时间缩短50%，精度损失控制在2%以内。
- **硬件友好性**：在资源受限的嵌入式设备（如树莓派）上，FedFreeze的本地冻结策略可减少85%的浮点运算量，同时保持80%以上精度。
- **跨平台泛化**：在Raspberry Pi和Jetson Nano两种异构硬件平台上，FedFreeze均实现1.1-1.3倍加速，验证了策略的普适性。

### 挑战与未来方向
1. **动态阈值调整**：当前阈值依赖人工设定，未来需引入自适应学习机制。例如，通过在线梯度聚类算法自动识别冻结阈值。
2. **跨域泛化**：现有方法在预训练初始化中表现更优，但需解决预训练数据与实际场景的分布偏移问题。
3. **扩展性验证**：当前研究聚焦于CNN，未来需验证在Transformer架构中的有效性。

### 结论
FedFreeze通过设备端和服务器端的协同冻结机制，解决了联邦学习中的计算效率与模型精度矛盾。其实验结果表明，在资源受限场景下，该框架可提升1.3倍训练速度，同时将精度损失控制在1.67%以内，为边缘计算环境中的大规模分布式训练提供了新范式。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号