联邦学习在人类活动识别中的应用:通过创新聚合技术平衡隐私、效率与准确性

【字体: 时间:2025年08月12日 来源:Array 4.5

编辑推荐:

  推荐:为解决人类活动识别(HAR)中数据隐私与模型性能的平衡问题,研究人员开展基于联邦学习(FL)的聚合技术研究。通过比较Vanilla Averaging、Weighted Averaging等5种聚合策略与MLP/CNN模型组合,发现CNN结合Selective Averaging技术实现92.30%准确率,为边缘设备部署提供隐私保护解决方案。

  

在智能穿戴设备普及的今天,人类活动识别(Human Activity Recognition, HAR)技术已成为健康监测和智能交互的核心。然而,传统集中式训练需要上传敏感的运动传感器数据,用户隐私如同"裸奔"在服务器之间。更棘手的是,不同用户的运动模式差异大,单一模型难以泛化,而边缘设备的计算资源又限制了复杂模型的部署。这种隐私、性能和资源的三重矛盾,正是联邦学习(Federated Learning, FL)技术大显身手的舞台。

针对这一挑战,北南大学(North South University)电气与计算机工程系的研究团队开展了一项创新研究。他们巧妙地将轻量级深度学习模型与五种FL聚合策略相结合,在保护数据隐私的前提下,使模型准确率突破92%大关。这项发表在《Array》的工作,为可穿戴设备上的实时活动识别提供了兼顾效率与隐私的解决方案。

研究团队采用了两大关键技术路线:首先构建MLP(多层感知器)和CNN(卷积神经网络)两种轻量级模型架构,分别针对计算效率和特征提取能力进行优化;其次设计了包括Selective Averaging在内的五种创新聚合策略,利用UCI-HAR数据集中的智能手机传感器数据(来自30名受试者的加速度计和陀螺仪数据),通过联邦学习框架实现分布式训练。其中Selective Averaging策略仅筛选高于平均准确率的本地模型参与聚合,有效提升了全局模型性能。

在模型架构比较方面,研究发现CNN模型凭借其优异的特征提取能力,在所有FL策略中均表现最佳,特别是结合Selective Averaging时达到92.30%的准确率和92.37%的F1值。而MLP模型虽然准确率略低(90.19%),但参数数量仅为CNN的1/3,推理时间缩短50%,更适用于资源受限的边缘设备。

聚合策略的对比实验揭示了关键发现:Selective Averaging技术显著优于传统方法,其通过设置准确率阈值筛选高质量模型更新的机制,使全局模型避免了低质量更新的干扰。Best-Model Update策略虽然计算效率最高(CNN仅需2.29秒),但性能波动较大;而Continual Federated Learning通过两阶段训练缓解了灾难性遗忘问题,但付出了双倍计算时间的代价。

研究还通过精心设计的消融实验证实了FL框架的优越性。与集中式训练相比,FL环境下的CNN模型准确率提升了1.28%,这得益于聚合过程中融合了多样化的本地数据特征。特征重要性分析则表明,传感器数据的所有特征都对模型性能有贡献,任意特征剔除都会导致准确率下降3-5个百分点。

这项研究的创新价值在于:首次将Selective Averaging这一新型聚合技术引入HAR领域,通过数学公式θG=∑i∈Sθi?wi/∑i∈Swi实现了精准的模型筛选与加权。在隐私保护方面,该框架确保原始运动数据始终留在用户设备本地,仅传输模型参数更新,有效解决了医疗监测等敏感场景的数据安全问题。

展望未来,这种结合轻量级模型与智能聚合策略的FL框架,不仅适用于健身追踪,还可拓展至帕金森病运动症状监测等医疗领域。研究团队在讨论部分特别指出,探索强化学习与FL的结合,或将成为实现自适应个性化模型的新方向。正如论文所述,这项工作为"隐私、效率和准确性"这个不可能三角提供了极具说服力的平衡方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号