改进自监督垂直联邦学习:实例对比相似性与动态平衡池的协同增效

【字体: 时间:2025年05月12日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  在垂直联邦学习(VFL)中,标记样本稀缺及领域偏移问题突出。研究人员提出改进自监督垂直联邦学习(ISSVFL)框架。实验表明其性能平均提升 3.3%,有效缓解领域偏移,为 VFL 发展提供新方向。

  随着数据隐私法规的日益严格,如欧盟《通用数据保护条例》的颁布,数据的获取和使用受到了更严格的管控。在这样的大背景下,联邦学习(Federated Learning,FL)作为一种能在保障隐私的前提下,让独立参与者协同执行机器学习任务的范式应运而生。垂直联邦学习(Vertical Federated Learning,VFL)是 FL 领域的关键研究方向,它基于参与者数据集在特征空间不同,但样本 ID 空间部分相同的前提,利用互补数据提升深度学习效果,在金融、广告、医疗等多个行业展现出巨大的应用潜力。
然而,VFL 在实际应用中面临着诸多挑战。传统 VFL 主要依赖对齐的标记样本进行模型训练,但标记样本的获取既耗费人力又成本高昂,而且不同参与者之间的对齐样本相对稀少,这使得传统 VFL 难以有效训练模型。为了利用参与者手中大量的未标记样本,当前 VFL 框架尝试引入对比自监督学习(Contrastive Self-Supervised Learning,CSSL)方法。但现有研究只是简单地将 CSSL 方法融入 VFL,未能解决严重的领域偏移问题,即不同参与者的数据特征分布差异显著。此外,CSSL 方法的优化目标常与用于缓解领域偏移的一般正则化方法相冲突,极大地限制了自监督学习框架在 VFL 中的潜力。

为了解决这些问题,来自未知研究机构的研究人员开展了关于改进自监督垂直联邦学习的研究,并将成果发表在《Future Generation Computer Systems》上。研究人员提出了改进自监督垂直联邦学习(Improved Self-Supervised Vertical Federated Learning,ISSVFL)框架,该框架旨在标签稀缺场景下,基于半诚实且无共谋假设,有效缓解领域偏移,提升 VFL 模型性能。这一研究成果意义重大,它为 VFL 在实际应用中的进一步发展提供了新的思路和方法,有助于打破当前面临的困境,推动相关行业利用 VFL 更好地发挥数据价值。

研究人员在开展此项研究时,运用了以下几个主要关键技术方法:一是提出联邦对比实例相似性学习(Federated Contrastive Instance-wise Similarity Learning,FCISL)模块,该模块在预训练阶段,通过对齐参与者之间的实例相似性,实现 VFL 中垂直划分特征的表示级知识转移;二是设计了新的动态平衡池(Dynamical Balance Pool,DBP)模块,用于在下游监督任务中动态平衡域间和域内知识,对预训练模型进行微调。

研究结果


  1. FCISL 模块缓解领域偏移:通过实验验证,FCISL 模块将 CSSL 方法与实例相似性相结合,解决了正则化冲突,能够从不同参与者的表示中捕获更有价值的域间知识,增强了 VFL 模型在自监督学习框架内的泛化能力,从而有效缓解领域偏移。
  2. DBP 模块提升模型性能:DBP 模块可以动态平衡域间和域内知识,在对预训练模型进行微调以适应下游监督任务时,进一步提升了最终联合 VFL 模型的性能。
  3. 整体性能优势显著:在图像和表格数据集上进行的大量实验表明,ISSVFL 相较于最先进的基线模型,平均性能提升了 3.3%,在标签稀缺场景下展现出卓越的性能。
  4. 有效抵御隐私攻击:对 ISSVFL 框架进行的隐私分析显示,该框架能有效抵御先进的标签推断攻击,保障了数据的隐私安全。

研究结论与讨论


研究人员提出的 ISSVFL 框架成功解决了 VFL 中存在的关键问题。FCISL 模块化解了正则化冲突,充分挖掘了域间知识,增强了自监督学习框架在 VFL 中的潜力;DBP 模块动态平衡知识,优化了模型性能。大量实验验证了 ISSVFL 在标签稀缺场景下的优势,其平均性能提升 3.3%,且具备强大的隐私保护能力。这一研究成果不仅为 VFL 在实际应用中的发展扫除了障碍,也为后续研究提供了重要参考,推动了垂直联邦学习领域的进一步发展。未来,研究人员可在此基础上,继续探索更高效的算法和更强大的隐私保护机制,以适应不断变化的实际需求。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号