
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Fed3Scale:面向云-边-端协同的隐私保护半监督分层联邦学习框架及其在异构环境中的应用
【字体: 大 中 小 】 时间:2025年06月19日 来源:Knowledge-Based Systems 7.2
编辑推荐:
为解决联邦学习(FL)中计算异构性、非独立同分布(non-IID)数据及标注稀缺等难题,山东大学团队创新性提出三尺度分层联邦学习框架Fed3Scale。该研究通过云-边-端协同计算架构、特征级差分隐私保护及基于同态加密的聚合半监督学习(AggSSL)策略,在CIFAR-10等数据集上实现准确率提升5.77%,为智能医疗等隐私敏感场景提供新范式。
在人工智能技术深度渗透生产生活的今天,大模型训练与智能应用面临严峻的隐私泄露风险。传统联邦学习(FL)虽通过本地训练保护数据隐私,却受限于客户端计算能力差异、数据分布不均(non-IID)及标注数据匮乏等瓶颈。更棘手的是,现有双层FL架构难以协调云端强大算力与边缘设备低延迟优势,而标注成本高昂导致半监督学习(SSL)在分布式场景举步维艰。这些矛盾在医疗影像分析等敏感领域尤为突出——既需利用海量未标注数据提升模型性能,又必须确保患者隐私不被泄露。
针对这一系列挑战,山东大学Luqi Wang团队在《Knowledge-Based Systems》发表研究,提出革命性的三尺度协同框架Fed3Scale。该研究创新性地整合云端预训练、边缘服务器(ES)协同聚合与客户端轻量化推理,通过特征级差分隐私扰动和同态加密损失函数构建双重防护,最终在保证隐私前提下使模型准确率显著超越现有基线方法。
关键技术包括:(1)构建云(CS)-边(ES)-端三级计算架构,利用云端预训练编码器降低客户端负载;(2)设计聚合半监督学习(AggSSL)策略,通过ES间无监督聚合与CS-ES协同半监督训练解决标注稀缺问题;(3)采用特征级差分隐私保护上传数据,结合同态加密保护标签信息;(4)在CIFAR-10等真实数据集上验证IID/non-IID场景下的鲁棒性。
【框架概述】
研究团队设计的多分支树状架构中,CS负责预训练任务特异性编码器,客户端仅需执行特征提取,计算负载降低90%。ES作为中间层既与关联客户端进行监督训练,又与其他ES开展无监督模型聚合,形成"局部监督-全局无监督"的混合学习范式。
【实验设置】
在Tesla A100服务器构建的测试环境中,Fed3Scale在non-IID数据分布下表现尤为突出。相比基线方法FedAvg,其在CIFAR-10上的分类准确率提升达5.77%,且客户端能耗降低显著。
【讨论】
该框架在工业质检等场景展现巨大潜力:某医疗器械厂商采用Fed3Scale后,在保护患者隐私前提下,利用90%未标注影像数据将缺陷识别率提升8.2%。加密损失函数设计有效防止了梯度反演攻击,特征级处理使数据传输量减少76%。
【结论】
作为首个同时解决计算异构性与半监督学习的HFL研究,Fed3Scale通过三级算力协同与双重隐私保护机制,为资源受限环境下的智能应用提供新思路。其创新性体现在:(1)首创AggSSL策略实现跨边缘一致性正则化;(2)客户端完全脱离模型训练,仅需1%原始算力;(3)加密损失函数设计填补了标签泄露防护空白。该成果不仅推动联邦学习向实用化迈进,更为医疗、金融等敏感领域的AI部署树立隐私保护新标杆。
生物通微信公众号
知名企业招聘