
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Flight框架:基于FaaS的复杂层次化联邦学习系统设计与实现
【字体: 大 中 小 】 时间:2025年07月16日 来源:Future Generation Computer Systems 6.2
编辑推荐:
推荐:针对传统联邦学习(FL)框架仅支持简单双层拓扑的局限,研究人员开发了基于FaaS的Flight框架,支持多级层次化拓扑和异步聚合,实现控制面与数据面解耦。实验表明其支持2048个设备并发,通信开销降低60%,为物联网等复杂网络环境提供高效FL解决方案。
在物联网(IoT)和移动边缘计算(MEC)时代,数据天然分布在智能电表、传感器等终端设备上。传统集中式AI训练面临数据迁移成本高、隐私风险大的困境。联邦学习(FL)通过"数据不动模型动"的分布式训练范式崭露头角,但现有框架如Flower仅支持设备直连服务器的简单双层架构,无法适应现实世界中互联网等复杂网络的层次化、地理聚类特性。
美国芝加哥大学与阿贡国家实验室联合培养的博士后Nathaniel Hudson团队在《Future Generation Computer Systems》发表研究,提出Flight框架。该工作创新性地采用函数即服务(FaaS)架构,通过Globus Compute和ProxyStore实现控制面与数据面解耦,支持自定义多级聚合拓扑。关键技术包括:1) 分层异步聚合策略;2) 基于Python的模块化接口设计;3) 支持从模拟到真实设备的全栈部署方案;4) 动态参数传输优化机制。
【Background & related work】
研究系统梳理了层次化联邦学习(HFL)的理论基础,指出传统FL在智能家居等场景中忽视地理空间数据分布模式的缺陷。例如智能电表数据与收入水平的地理相关性,需要通过中间聚合器提取区域特征。
【Flight: Design & implementation】
框架采用三层抽象设计:1) 策略层定义聚合规则;2) 通信层处理参数传输;3) 执行层通过launcher适配不同计算环境。实验显示其单节点支持2048个worker并发,远超Flower的256个上限。
【Strategies】
提出可扩展的Strategy抽象接口,支持FedAvg等算法扩展。在ResNet-18模型上,层次化聚合使通信量减少63.7%,异步训练使makespan缩短41.2%。
【Evaluation】
AWS真实设备测试表明,Flight在CIFAR-10数据集上达到82.3%准确率,通信开销降低60.5%。地理分布式实验中,区域聚合器使广域网流量减少58%。
该研究开创性地解决了复杂拓扑下的FL部署难题,其开源实现为智慧城市等场景提供新范式。未来工作将探索动态拓扑调整和差分隐私集成,进一步推动边缘智能发展。论文证实层次化设计可使ResNet-18训练速度提升2.1倍,为IoT大规模FL应用奠定基础。
生物通微信公众号
知名企业招聘