
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多类型建筑AHU系统真实运行数据的自动化故障检测与诊断数据集构建研究
【字体: 大 中 小 】 时间:2025年08月27日 来源:Scientific Data 6.9
编辑推荐:
本研究针对建筑暖通空调系统中空气处理机组(AHU)的自动化故障检测与诊断(AFDD)缺乏真实运行数据的问题,通过采集办公大楼、礼堂和医院三种典型建筑的恒风量(CAV)系统AHU运行数据,构建了包含11-17万条标注数据的数据集。研究采用定制化数据采集、缺失值处理、系统标注和分层抽样等方法,首次提供了涵盖7种运行状态(1种正常+6种故障)的多场景基准数据集,为开发高精度机器学习模型奠定基础,成果发表于《Scientific Data》。
在现代建筑环境中,暖通空调(HVAC)系统的空气处理机组(AHU)如同建筑的"肺部",负责调节室内温度、湿度和空气质量。然而这些复杂系统常因传感器故障、阀门卡滞等问题导致能效下降,传统人工检测方式效率低下。尽管已有基于实验室和模拟数据的自动化故障检测与诊断(AFDD)方法,但真实建筑环境中的动态变化、设备老化和突发状况往往难以被模拟数据复现。更关键的是,不同建筑类型(如人流密集的医院与间歇使用的礼堂)存在显著差异的运行特征,但学术界长期缺乏系统化的真实运行数据集,严重制约了AFDD技术的实际应用。
针对这一瓶颈,Seunghyeon Wang团队在《Scientific Data》发表了突破性研究。研究人员创造性选取了韩国三种典型建筑——5万平方米的大型办公楼、1.6万平方米的世宗艺术中心礼堂和1.9万平方米的国立癌症中心医院新翼,对其13-20台AHU系统进行全年不间断监测。这些建筑不仅代表城市主要功能场景,其恒风量(CAV)系统更是全球约65%商业建筑采用的经典配置,使研究成果具备广泛适用性。
研究采用四大关键技术方法:1) 多场景定制化采集,根据建筑特点配置15-18类传感器(如表1所示的送风温度、阀门开度等),原始1分钟数据聚合为小时级;2) 严格数据清洗,对礼堂缺失505条、医院缺失4032条数据直接剔除,办公室332条重复记录去重;3) 6位20年经验HVAC专家依据ASHRAE标准制定7类状态标注规范(如表7),包括送风机故障(SFF)、冷却泵故障(CPF)等;4) 采用分层抽样将数据按6:2:2划分为训练-验证-测试集,确保小样本故障类别均衡。
Auditorium数据集
13台AHU产生113,880条数据,如图1所示传感器布局覆盖舞台、观众区等特殊空间。表2显示各机组容量差异显著(如主舞台AHU-07冷却能力126kW,而休息室AHU-13仅37.9kW),导致故障分布独特:冷却泵故障(CPF)占17.02%,加热泵故障(HPF)高达21.95%(表8),反映文化场馆间歇运行特性。
Hospital数据集
8台AHU的70,080条数据展现医疗环境特殊性(图2)。表3显示检查室AHU-N06制冷量达358kW,是标准病房AHU-N07的1.2倍。异常的是,81.39%数据为正常状态(图4),仅出现4类故障,其中回风温度传感器故障(RATSF)占13.38%(表8),可能与医院24小时不间断运行导致的传感器损耗相关。
Office数据集
20台AHU产生175,532条数据(图3),表4显示实验室区域AHU冷却能力普遍高于办公区。27.34%的送风机故障(SFF)占比(表8)暴露现代办公楼变负荷运行的控制难题,而阀位故障(VPF)仅0.06%,印证了办公设备维护优势。
这项研究创建了首个跨建筑类型的AHU真实运行数据库,其三大创新价值尤为突出:首先,数据集精确反映现实复杂性,如表11所示的经济器模式(室外空气直接冷却)等特殊工况,弥补了模拟数据不足;其次,分层标注使模型可识别7类状态,其中医院未出现的CPF/HPF(表9)恰好验证了建筑间故障模式差异;最后,28.7万条训练数据(表9)为Transformer等先进算法提供充足素材,Wang6团队已基于此开发出准确率达92%的诊断模型。
该成果不仅为AFDD研究设立新基准,更推动行业范式转变——设施管理者可直接将验证模型接入楼宇自控系统(BMS),实现从"被动维修"到"预测性维护"的跨越。正如作者强调,未来研究应关注数据集动态更新机制,并探索跨建筑类型的迁移学习,以应对全球建筑低碳化的迫切需求。
生物通微信公众号
知名企业招聘