联邦学习框架下多输出高斯过程的自动潜在变量选择方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年09月10日 来源：Pattern Recognition 7.6

编辑推荐：

　　本文提出了一种基于联邦学习（FL）的多输出高斯过程（MGP）建模方法，通过分层贝叶斯框架和尖峰-平板先验（spike-and-slab priors）实现跨单元潜在变量的自动选择，解决了传统集中式MGP中潜在函数数量难以确定及隐私风险问题。该方法在锂离子电池退化与气温数据案例中验证了其高效性与隐私保护优势。

亮点

• 我们构建了一个线性核心化模型（LMC），其特点包括：(i) 无需共享原始数据即可估计跨单元协方差；(ii) 通过枢纽-辐条架构、诱导点方法和潜在函数系数的稀疏先验，自动推断共享模式所需的潜在函数数量。

• 提出联邦学习框架，在保护单元本地数据隐私的前提下，利用分布式计算资源完成模型参数估计与个性化预测，规避传统集中式MGP的算力瓶颈。

• 为新加入系统的单元设计了学习策略，使其仅需关注已选定的潜在函数即可快速适配模型，无需其他单元参与计算。

• 在可靠性工程与气候数据应用中验证了模型的有效性。

文献综述

多输出高斯过程（MGP）最初作为地统计学中的协同克里金法（cokriging）被提出，现已广泛应用于医疗健康、交通系统和设备预后等领域。现有研究多采用集中式训练框架，难以平衡模型复杂性与泛化能力，且面临隐私泄露风险。

方法

基于枢纽-辐条架构构建分层LMC模型，对每个单元的潜在函数系数施加尖峰-平板先验，通过变分贝叶斯近似推导联邦兼容的目标函数下界。该框架支持：(1) 单元间协同训练时仅传递加密的统计量；(2) 利用本地算力并行优化超参数；(3) 动态剪枝冗余潜在函数。

实验

仿真与真实数据（如锂离子电池退化曲线RUL预测）表明，FedLMC-SS模型在预测精度上显著优于独立高斯过程（IGP）和正交瞬时线性混合模型（OILMM），同时将通信开销降低60%以上。

局限性

当单元间信号相关性较弱时可能引发负迁移（negative transfer）；联邦设置对客户端异构数据（non-IID）敏感；变分近似可能低估预测不确定性。

结论

本研究通过联邦学习与自动变量选择的结合，为大规模物联网系统中跨设备知识迁移提供了可扩展且隐私安全的解决方案，未来可拓展至医疗多中心数据联合建模等场景。

（注：翻译部分严格遵循了术语标注、保留专业符号（如RUL、non-IID）的要求，未包含文献引用标识，并采用^{/_{处理上下标，如N_m）}}

热点排行

新闻专题

联系信箱：

粤ICP备09063491号