基于多方同态加密的联邦学习隐私保护超参数调优新框架PRIVTUNA
《IEEE Transactions on Privacy》:Privacy-Preserving Hyperparameter Tuning for Federated Learning
【字体:
大
中
小
】
时间:2025年11月20日
来源:IEEE Transactions on Privacy
编辑推荐:
本文针对跨机构联邦学习(FL)中超参数(HP)调优的隐私保护难题,提出了一种高效的单次HP调优方法。研究人员通过全面测量研究,发现在独立同分布(iid)和非独立同分布(non-iid)设置下,分别可采用HP平均和基于密度的聚类(DBSCAN)策略,从客户端本地最优HP中准确推导服务器端HP。为解决HP共享导致的隐私泄露风险,作者设计了基于多方同态加密(MHE)的PRIVTUNA框架,实现了隐私保护的联邦均值(PF-Mean)和DBSCAN(PF-DBSCAN)算法。实验表明,PRIVTUNA在保证HP调优精度的同时,显著降低了计算/通信开销,为隐私保护联邦学习(PPFL)提供了实用解决方案。
在人工智能飞速发展的今天,数据隐私和安全已成为制约技术落地的关键瓶颈。联邦学习(Federated Learning, FL)作为一种分布式机器学习范式,允许多个客户端在不共享原始数据的情况下协同训练模型,为医疗、金融等敏感数据场景提供了理想解决方案。然而,联邦学习的实际应用仍面临两大挑战:一是超参数(Hyperparameter, HP)配置对模型性能至关重要,但传统的调优方法在联邦环境下会引入巨大通信开销;二是即使不直接共享数据,客户端上传的模型更新或超参数仍可能泄露隐私信息,近年来研究证实攻击者可通过成员推断等手段从共享信息中反推训练数据特征。
更棘手的是,当联邦学习系统引入差分隐私(DP)、安全多方计算(MPC)或同态加密(HE)等隐私增强技术(PETs)强化保护时,超参数调优会变得愈加复杂——差分隐私需要消耗大量隐私预算,而加密计算则大幅增加迭代成本。现有高效调优方案如FLoRa虽采用单次HP调优范式,却未解决客户端本地HP共享带来的新型隐私泄漏风险。这一矛盾在医疗、金融等跨机构(cross-silo)协作场景中尤为突出,促使研究者探索既高效又隐私的HP调优新路径。
针对这一难题,来自Kera Health Platforms、瑞典RISE研究所和比尔肯特大学的研究团队在《IEEE Transactions on Privacy》发表最新研究,提出了隐私保护超参数调优框架PRIVTUNA。该研究首先通过大规模测量实验验证了一个关键假设:服务器端最优HP配置可从客户端的本地HP中准确推断。团队在MNIST、EMNIST、SVHN和CIFAR-10等多个数据集上,针对卷积神经网络等模型架构,系统比较了均值、中位数、裁剪均值及DBSCAN聚类等HP聚合策略。实验发现:在数据分布均匀的iid设置中,简单的HP平均策略即可获得接近全局网格搜索的效果;而在更贴近现实的非iid场景(包括标签偏移、特征偏移和数量偏移)中,基于密度的聚类算法(DBSCAN)表现出色,在95%的实验中其推导的HP与真实最优解的绝对距离最小。尤为重要的是,与当前最优方案FLoRa相比,DBSCAN策略在各类非iid设置下平均验证准确率更高。
基于这些发现,团队创新性地设计了PRIVTUNA——首个基于多方同态加密(Multi-party Homomorphic Encryption, MHE)的隐私保护HP调优框架。该框架允许客户端使用集体公钥加密本地HP后上传至服务器,服务器直接在密文上执行聚合计算,最终通过多方协作解密获得全局HP,确保除最终结果外全程不泄露任何客户端HP信息。研究团队重点实现了两种核心算法的隐私保护版本:私有联邦均值(PF-Mean)通过同态加法和除法实现;私有联邦DBSCAN(PF-DBSCAN)则采用网格化离散处理,通过两轮加密聚合完成密度聚类,其中创新的比较操作采用Cheon等提出的近似方案支持密文域执行。
关键技术方法方面,研究主要依托多方同态加密(MHE)技术,特别是CKKS方案支持浮点数计算的特点。客户端本地执行超参数优化(LHO)后,采用密文打包(packing)技术将多维HP编码至单个密文。针对非线性的比较和除法运算,PF-DBSCAN结合Goldschmidt除法算法和基于引导(bootstrapping)的近似比较电路,确保在128位安全参数下完成密文运算。实验涵盖10-20个客户端规模,使用Lattigo密码库实现。
在iid设置中,随着客户端数量从10增至50,简单平均策略推导的服务器学习率和动量始终接近全局网格搜索(GHO)结果,且测试准确率损失可忽略(CIFAR-10除外)。非iid场景下,DBSCAN展现出显著优势:在标签偏移(β?=1.0)、特征偏移(βf=0.02)和数量偏移(βq=0.4)等多种分布中,其推导的学习率与真实最优值完全匹配,动量值虽有轻微偏差但未显著影响模型准确率(7/8实验准确率匹配GHO)。横向对比显示,DBSCAN在144组非iid实验中的综合表现优于FLoRa的四种损失面构建方法,尤其在标签偏移严重的SVHN数据集上优势明显。
性能测试表明,PF-Mean在10客户端/20客户端设置下分别仅需1.6秒/1.8秒完成计算,PF-DBSCAN因包含密集的密文比较操作,耗时增至5.8秒/18.3秒,但仍远低于传统PPFL框架(如POSEIDON进行49轮网格搜索需147小时)。通信方面,每个客户端在PF-DBSCAN中仅需传输3个密文(约7.86-28.29MB),线性扩展性良好。精度评估中,PF-Mean的均方误差(MSE)低至10-4量级,PF-DBSCAN因近似计算MSE略高(最高1.02×10-3),但对HP调优精度影响可忽略。
结论与讨论部分强调,这项研究首次系统论证了从客户端本地HP推导服务器HP的可行性,并针对iid/non-iid场景给出了具体策略。PRIVTUNA框架的创新性在于将单次HP调优范式与多方同态加密深度融合,解决了隐私保护与调优效率的矛盾。尽管当前研究聚焦学习率和动量两个关键HP,但框架可扩展至正则化系数、批大小等更多参数联合优化。作者指出,未来工作将探索理论支撑、更多客户端规模验证以及文本/表格数据场景的适应性。这项成果为高隐私要求的跨机构协作学习提供了实用工具,特别是对医疗影像分析、金融风控等敏感数据融合场景具有重要推广价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号