智能建筑能源管理优化:基于六年真实世界数据集的机器学习与多目标决策研究

【字体: 时间:2025年05月25日 来源:Scientific Data 5.8

编辑推荐:

  为解决建筑能耗占全球能源消耗40%但高质量数据稀缺的难题,Honda Research Institute Europe团队发布了一个包含72个电表、9个热表及气象站数据的六年期(2018-2023)智能建筑能源数据集。该数据集通过层次化计量结构和多级数据处理(含异常标记与校正),支持EMS(能源管理系统)、CHP(热电联产)优化、负荷预测及异常检测等应用,为降低碳排放和运营成本提供了真实场景基准。

  

在全球能源转型背景下,建筑能耗占欧盟和美国初级能源消耗的40%,但高质量能源数据的稀缺严重制约了能效优化研究。现有数据集往往因采集成本高、设备故障或商业保密而难以获取,且缺乏长期、多层级计量结构的数据。为此,Honda欧洲研究院联合德国达姆施塔特工业大学等机构,发布了首个涵盖六年完整周期(2018-2023)的智能建筑能源数据集,覆盖COVID-19疫情期间的运营变化,为机器学习与优化算法提供了真实场景验证平台。

研究团队在德国奥芬巴赫的工业设施中部署了72个电表、9个热表和气象站,采集了包括光伏系统(PV,749 kWp)、燃气热电联产机组(CHP,199 kWel)及中央制冷系统(1550 kW)的逐分钟数据。通过Modbus/RTU协议和时序数据库(influxdb)构建采集体系,并开发了包含手动标注、规则检测(零值/跃变/间隙)、时间对齐及多级插值的处理流水线。特别针对冷却主表V.K21机械故障等典型问题,采用下游子表数据重构技术,最终生成103 GB的标准化数据集(含1 min/15 min/1h分辨率版本)。

数据记录与验证
数据集通过层次化计量结构(图1)整合了电、热、气象三类数据,其中电力数据包含相位级电压(U1-3)、电流(I1-3)及功率因数(PF),热力数据涵盖流量(qv)与温差(Tdiff)。验证显示3.1%时间存在数据间隙,但通过周周期克隆填充和功率-能量联合校正(公式3-10),平均相对误差仅0.28%。桑基图(图5)揭示设施62%电力依赖电网,CHP和PV分别贡献22%和16%能源,而排放实验室占60%总耗电。

技术亮点

  1. 时间漂移校正:利用电网频率瞬态特性(图9),以VisualGateway同步数据为基准对齐非同步网关数据;
  2. 异常处理创新:对CHP线干扰导致的H1.Z19相位不对称(2022年3-11月)实施数据剔除;
  3. 冗余设计:2023年加装的ZE系列电表(如H4.ZE50)为硬件故障提供备份数据源。

结论与意义
该研究首次公开了涵盖建筑能源全链条的长期真实数据,其层次化计量和严格质量控制为EMS(如模型预测控制MPC)、负荷分解(图8工作日/周末模式)及多目标优化(文献12-16)提供了基准。数据集已用于降低13%年度能耗(图6),并通过PV扩容(2020年)和CHP调制策略更新(2023年)验证了动态调控价值。未来可扩展至网络推断(文献23-25)或数字孪生系统,推动建筑领域碳中和进程。

(注:所有数据及处理代码已开源于Dryad和GitHub,符合CC BY-NC-ND 4.0协议)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号