建筑占全球总能源消耗的40%以上(Shi, Gao, Xu, Xu, & Jiang, 2024)。精确和实时的建筑能耗预测对于制定科学的能源生产和管理方案至关重要(Deb, Zhang, Yang, Lee, & Shah, 2017)。先进的计量基础设施(AMI)已广泛应用于各种能源密集型建筑中。AMI收集了大量用于能源分析和预测的数据。因此,基于数据的方法,特别是利用神经网络的方法(Agga, Abbou, Labbadi, & Houm, 2021),已成为主要的预测模型。然而,这些方法严重依赖于可用数据的数量和质量。近年来,隐私保护法规的实施(如欧盟的通用数据保护条例(GDPR)(McKenna, Richardson, & Thomson, 2012)对数据利用施加了重大限制,给这些方法的实际应用带来了挑战。
数据加密(El-Latif, Abd-El-Atty, Mazurczyk, Fung, & Venegas-Andraca, 2020)技术可以缓解数据可用性的问题,但它们需要在数据效用和隐私保护之间进行微妙的权衡(Chen, Li, Cheng, & Liu, 2023)。在建筑能耗预测的分布式多任务场景中,仅依赖数据加密可能不是明智的做法。为了解决这一挑战,联邦学习(FL)(Kone?ny et al., 2017),作为一种先进的分布式学习范式,提供了一个有前景的解决方案。FL可以利用参与客户的本地模型信息来训练强大的模型,而不会侵犯隐私。在(Badr, Mahmoud, Fang, Abdulaal, Aljohani, Alasmary, Ibrahem, 2023b, Fernández, Menci, Lee, Rieger, Fridgen, 2022, Shi, Xu, 2022)中,FL在建筑能耗预测领域展示了其成功。然而,FL在这一领域的应用面临一个主要挑战,即冷启动问题,如图1所示。这个问题源于新加入FL训练的建筑可用数据有限,导致这些建筑的预测性能下降。在FL框架内,这一挑战可以被描述为小样本或零样本学习场景。具体来说,训练好的全局预测模型无法适应新建筑数据的分布变化。在数据受限的情况下,研究人员通常转向迁移学习(TL),通过最小化领域差异来提高目标领域的预测性能。在(Tang, Zhang, & Zhang, 2024)和(Tang, Xie, Wang, & Bie, 2023a)中,一个保护隐私的全局模型在FL框架中被训练出来,然后对其进行微调以提升数据稀缺建筑的预测性能。然而,TL对于缺乏历史数据的新建建筑来说效果不佳。因此,使用FL框架中的现有数据训练一个能够适应未知建筑数据分布变化的模型对于解决冷启动问题非常重要。这项工作需要提高模型的泛化性能,这一挑战被称为领域泛化(DG)问题(Wang et al., 2021)。
然而,将现有的DG技术整合到FL框架中并不简单。例如,领域不变表示学习方法(Li, Gong, Tian, Liu, Tao, 2018, Nguyen, Tran, Gal, Baydin, 2021, Sun, Saenko, 2016)通常依赖于集中式训练环境,其中数据或其表示在各个领域之间共享。同样,基于元学习的方法(Balaji, Sankaranarayanan, & Chellappa, 2018)需要访问来自多个源领域的数据,这些数据通常存储在中央服务器上(Nguyen, Torr, & Lim, 2022)。除了违反FL的分布式特性外,这些方法还存在隐私泄露的风险。一些先前的工作已经尝试在FL环境中应用DG。在(Liu, Chen, Qin, Dou, & Heng, 2021)中,一种定制的医学图像分割方法从不同医院数据的共享连续频率空间中学习领域不变性。联邦领域泛化(FedADG)(Zhang, Lei, Shi, Huang, & Chen, 2021)通过对抗学习来提高泛化性能,该方法通过将每个分布与参考分布匹配来测量和对齐各个源领域的分布。尽管这种方法完全防止了隐私泄露,但它过于复杂,其在建筑能源管理领域的收敛性和适用性仍需验证。
在本文中,我们提出了一种模型不可知的但有效的DG方法,用于FL环境中的建筑能耗预测,以解决冷启动问题。具体来说,提出了一种采用变分贝叶斯正则化(VBR)的表示学习方法,通过将生成的表示与参考分布对齐来学习领域不变表示,从而防止表示学习过多的领域特定知识而不会泄露数据。需要强调的是,我们的工作是首次在FL环境中应用变分贝叶斯机制来实现DG,尽管这种机制在深度学习中并不罕见。为此,我们证明了VBR可以隐式地调整表示的条件分布,并建立了其与条件互信息的理论联系。这些理论基础确保了VBR的有效性。此外,我们提出了FedEM,一种用于在FL环境中训练基于VBR的网络的交替优化方法。FedEM将优化过程分为期望步骤(专注于学习表示网络)和最大化步骤(用于优化预测网络),确保优化过程中的单调性并提高模型收敛速度。
我们工作的主要贡献如下:
•提出了一种基于VBR的表示学习方法,以在FL框架中实现DG,从而提高模型对未知建筑的预测性能,从而解决建筑能耗预测的冷启动问题。
•我们证明了VBR可以对表示分布进行对齐,并从DG理论的角度解释了VBR的有效性。
•我们提出了一种替代的优化算法(FedEM),用于在FL环境中学习基于VBR的模型,从而提高训练稳定性并加速模型参数的收敛。
•在真实世界的建筑能耗数据集上验证了所提出方法(VBR-FedEM)的有效性。模拟结果表明,VBR-FedEM显著提高了对未知建筑的预测性能,有效缓解了冷启动问题。
本文的其余部分组织如下。第2节介绍了相关工作,第3节介绍了所提出的方法,第4节进行了模拟,第5节总结了本文。