Flight框架:基于FaaS的复杂层次化联邦学习系统设计与实现

【字体: 时间:2025年07月16日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  推荐:针对传统联邦学习(FL)框架仅支持简单双层拓扑的局限,研究人员开发了基于FaaS的Flight框架,支持多级层次化拓扑和异步聚合,实现控制面与数据面解耦。实验表明其支持2048个设备并发,通信开销降低60%,为物联网等复杂网络环境提供高效FL解决方案。

  

在物联网(IoT)和移动边缘计算(MEC)时代,数据天然分布在智能电表、传感器等终端设备上。传统集中式AI训练面临数据迁移成本高、隐私风险大的困境。联邦学习(FL)通过"数据不动模型动"的分布式训练范式崭露头角,但现有框架如Flower仅支持设备直连服务器的简单双层架构,无法适应现实世界中互联网等复杂网络的层次化、地理聚类特性。

美国芝加哥大学与阿贡国家实验室联合培养的博士后Nathaniel Hudson团队在《Future Generation Computer Systems》发表研究,提出Flight框架。该工作创新性地采用函数即服务(FaaS)架构,通过Globus Compute和ProxyStore实现控制面与数据面解耦,支持自定义多级聚合拓扑。关键技术包括:1) 分层异步聚合策略;2) 基于Python的模块化接口设计;3) 支持从模拟到真实设备的全栈部署方案;4) 动态参数传输优化机制。

【Background & related work】

研究系统梳理了层次化联邦学习(HFL)的理论基础,指出传统FL在智能家居等场景中忽视地理空间数据分布模式的缺陷。例如智能电表数据与收入水平的地理相关性,需要通过中间聚合器提取区域特征。

【Flight: Design & implementation】

框架采用三层抽象设计:1) 策略层定义聚合规则;2) 通信层处理参数传输;3) 执行层通过launcher适配不同计算环境。实验显示其单节点支持2048个worker并发,远超Flower的256个上限。

【Strategies】

提出可扩展的Strategy抽象接口,支持FedAvg等算法扩展。在ResNet-18模型上,层次化聚合使通信量减少63.7%,异步训练使makespan缩短41.2%。

【Evaluation】

AWS真实设备测试表明,Flight在CIFAR-10数据集上达到82.3%准确率,通信开销降低60.5%。地理分布式实验中,区域聚合器使广域网流量减少58%。

该研究开创性地解决了复杂拓扑下的FL部署难题,其开源实现为智慧城市等场景提供新范式。未来工作将探索动态拓扑调整和差分隐私集成,进一步推动边缘智能发展。论文证实层次化设计可使ResNet-18训练速度提升2.1倍,为IoT大规模FL应用奠定基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号