《Journal of Building Engineering》:Interpretable Machine Learning for Occupant-Specific PM
2.5 Exposure Assessment in Higher Education Buildings
编辑推荐:
PM2.5暴露评估框架开发与关键驱动因素识别:结合CONTAM-EnergyPlus物理仿真与XGBoost-SHAP机器学习模型,系统分析高等教育机构建筑内PM2.5分布规律,揭示建筑密封性(Q50)主导暴露效应,提出需多策略协同的治理建议。
作者:Tha'er Abdalla | Chengzhi Peng
英国谢菲尔德大学建筑与景观学院,艺术塔,西岸,谢菲尔德 S10 2TN
摘要
室外来源的细颗粒物(PM?.?)对高等教育机构(HEI)的建筑内人员的健康构成重大风险,因为人们在这些建筑内长时间处于不同的功能空间中。本研究通过将 CONTAM–EnergyPlus 协同模拟与机器学习元模型以及基于 SHapley 加性解释(SHAP)的可解释性相结合,开发了一个可扩展的室内 PM?.? 暴露评估框架。在一个包含英国五所高等教育机构 2,729 个区域的极端梯度提升(XGBoost)元模型上进行训练后,获得了较高的预测准确性(R ≈ 0.95;在保留数据上的 R2 > 0.90)。SHAP 分析表明,建筑气密性(Q??)是主要的暴露驱动因素,其次是空气渗透换气率(ACHINF)和室内外温差(ΔT)。微观环境建模显示,在所假设的空间范围内,不同群体之间的暴露存在显著差异:办公室区域的工作人员暴露量较高,而教育设施则主要影响学生的暴露情况。将建筑气密性从基线提高到 Q?? = 3 m3/h·m2 可以将人群加权暴露量降低多达 32.3%;然而,大约 88% 的区域仍超过世界卫生组织 2021 年的年指导标准 5 μg/m3。这些发现表明,仅依靠改善建筑围护结构不足以达到 WHO 的标准,还需要结合机械通风和过滤策略,以及城市层面的政策(如清洁空气区和减少室外 PM?.? 的排放措施)。该框架为筛查高等教育机构建筑和优先考虑基于证据的空气质量干预措施提供了透明的、基于物理原理的基础。
引言
细颗粒物(PM?.?)的空气动力学直径小于 2.5 微米,由于其能够深入呼吸系统和心血管系统,因此对健康构成重大风险,导致发病率和过早死亡率增加(COMEAP 2009;Apte 等人,2018;Burnett 等人,2018;Pope 等人,2019;Krittanawong 等人,2023)。越来越多的证据表明,长期暴露于 PM?.? 会增加患痴呆症的风险,尤其是阿尔茨海默病(Huang 等人,2025;Rogowski 等人,2025)。世界卫生组织(WHO)最近更新了其空气质量指南,重申了年推荐 PM?.? 标准为 5 μg/m3,这一数值在 2021 年的修订版中确定,并在其 2025 年的空气质量标准数据库中得到强调(WHO,2025)。更严格的指南被认为是必要的,以更好地保护公众健康,因为全球和城市人口中有很大一部分仍暴露在高于此阈值的 PM?.? 浓度下,尤其是对脆弱群体来说,风险更大(Im 等人,2025)。
虽然室外 PM?.? 污染已得到广泛研究,但室内暴露同样关键,因为人们大约有 85-90% 的时间是在室内度过的(Pruszyński 等人,2023;Hancock 2018)。高等教育机构(HEI)的建筑代表了复杂的室内环境,具有多样化的空间布局、多个功能区域和异质化的 occupant 活动模式(Gaidajis 和 Angelakoglou,2009;Sarbu 和 Pacurar,2015;Emmerich 等人,2019),这给准确的室内空气质量(IAQ)评估带来了独特挑战(Branco 等人,2024;Lama 等人,2022;Erlandson 等人,2019)。尽管如此,仍存在显著的研究空白。首先,针对 HEI 建筑的深入 IAQ 研究很少(Erlandson 等人,2019;Lama 等人,2022),现有的工作很少将房间级别的暴露评估与可解释的建筑物理驱动因素建模结合起来(Sherman 和 Dickerhoff,1998;Taylor 等人,2014;2015;Jones 等人,2015;Gillott 等人,2016)。其次,虽然高保真的多区域气流和热模拟工具(如 CONTAM-EnergyPlus 框架)提供了物理上稳健的建模能力(Feustel,1999;Emmerich,2001;Hensen 和 Lamberts,2011;Dols 和 Polidoro,2020),但其计算强度限制了在大规模建筑群中的可扩展性。第三,能够解决这一可扩展性挑战的机器学习方法通常表现为“黑箱”,缺乏制定可操作政策所需的透明度。
为了解决这些空白,本研究开发了一个集成框架,该框架利用高分辨率的 CONTAM-EnergyPlus 协同模拟输出作为高级机器学习元模型的训练数据。该方法采用极端梯度提升(XGBoost;Chen 和 Guestrin,2016)与 SHapley 加性解释(SHAP;Lundberg 和 Lee,2017)相结合,为数千个室内区域提供快速的、特定于 occupant 的 PM?.? 暴露指标。据作者所知,这是首次在高等教育建筑中使用基于物理的元模型框架进行室内 PM?.? 暴露评估的 SHAP 基础应用,直接克服了复杂数据驱动的 IAQ 研究的传统“黑箱”限制。通过统计量化关键解释变量(如建筑围护结构气密性 Q??、空气渗透换气率 ACHINF 和室内外温差 ΔT)的边际贡献,该方法将复杂的预测转化为透明且可操作的见解,使研究结果可以直接转化为针对不同 HEI 群体的微观环境和人群加权暴露指标。
在这项研究中,该框架被应用于一所具有代表性的大学建筑群,系统地量化了供暖季节内 occupant 特定暴露的差异性。研究结果展示了将基于物理的模拟与可解释的机器学习相结合在复杂机构环境中推进室内空气质量建模的实用性,从而解决了当前 HEI 建筑房间级别、可解释暴露评估方面的空白。通过提供区域级别的、特定于 STG 的暴露指标和关键物理驱动因素的透明归因,该方法支持设施管理者和政策制定者制定基于证据的、有针对性的干预策略,以创造更健康的 HEI 环境。
材料与方法
本节描述了开发的集成建模框架,用于快速、可解释地预测 occupant 特定的 PM?.? 暴露。该方法首先使用我们之前基于物理的研究(Abdalla & Peng (2025) 的高分辨率 CONTAM–EnergyPlus 协同模拟输出作为训练机器学习元模型的基础输入数据。重点在于可扩展的预测建模和暴露评估组件,包括建筑群
关键暴露决定因素的识别
开发预测性机器学习(ML)框架的初始阶段需要定义影响室外来源渗透 PM?.? 浓度的最关键物理和环境参数(Ci)。鉴于 HEI 建筑环境中的复杂和非线性关系,对高分辨率的协同模拟输出进行了全面的敏感性分析,研究了线性、单调和非单调关系。
敏感性分析和 ML 元模型在 IAQ 评估中的效用
本研究解决了在复杂的 HEI 建筑中进行快速、大规模室内空气质量(IAQ)评估的挑战,尽管传统的基于物理的模拟精度很高,但在计算上非常耗时,不适用于整个机构的应用。为此,开发了一个新的集成框架,将高分辨率的 CONTAM-EnergyPlus 协同模拟与机器学习(ML)元模型相结合。这些 ML 元模型在计算上效率很高
结论
本研究开发了一个集成框架,将 CONTAM–EnergyPlus 协同模拟与 XGBoost 元建模和基于 SHAP 的可解释性相结合,用于 HEI 建筑内的室内 PM?.? 暴露评估。主要发现包括:
1.元模型准确性:
XGBoost 元模型在测试数据上取得了较高的预测准确性(R ≈ 0.95;在保留的建筑上的 R2 > 0.90),为 2,729 个区域提供了计算效率高的物理基础模拟替代方案。
2.主要暴露驱动因素:
CRediT 作者贡献声明
Tha'er Abdalla:可视化、验证、软件、方法论、调查、正式分析、数据整理。Chengzhi Peng:写作——审阅与编辑、撰写——原始草稿、监督、项目管理、方法论、调查、概念化
利益冲突声明
? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。