保持最佳的室内空气质量(IAQ)对于保护公共卫生、减少空气传播疾病的传播以及提高居住者生产力至关重要[1]。由于现代人约90%的时间都在室内度过,室内环境已成为人类接触污染物的主要场所[2,3]。有效的IAQ管理依赖于在源头控制污染物、管理其扩散路径以及确保个人防护。然而,污染物扩散路径受到多种因素的复杂相互作用的影响,包括建筑布局[[4], [5], [6]]、通风条件[[7], [8], [9]]以及居住者活动[10,11]。鉴于这些复杂性,准确表征扩散路径是有效IAQ管理的基本挑战。
为了分析室内污染物扩散路径,已经提出了多种方法。实验方法(如示踪气体研究)为模型验证提供了宝贵的真实数据,但通常不适合连续分析[9,12]。统计方法(如核密度估计)已被开发用于从单一空间内的稀疏传感器数据重建高分辨率的污染物场[13]。然而,这些方法本质上仅适用于单个房间,因为它们基于距离的计算无法考虑墙壁等物理障碍。多区域网络模型(例如CONTAM [14])将建筑物划分为多个区域,依靠质量平衡原理模拟房间间的复杂气流网络和污染物扩散[15]。然而,这些模型假设每个区域内完全混合,这在处理由热分层或局部通风引起的非均匀场时限制了其准确性[16]。计算流体动力学(CFD)模型可以提供高保真的三维气流模式和污染物浓度场表示,但其高昂的计算成本和对边界条件的敏感性限制了其在长时间、大规模场景中的应用[17,18]。
传统方法的局限性促使人们探索用于IAQ分析的数据驱动深度学习(DL)模型。尽管许多研究已成功使用DL模型进行室内污染物预测[[19], [20], [21], [22], [23], [24]],但这些模型仅限于预测任务,而没有通过模型可解释性来分析污染物扩散路径。这揭示了一个关键的研究空白:需要一个既能准确预测又能分析真实居住环境中路径的DL框架。
为了解决这一空白,需要一种针对室内污染物扩散固有的时空特性的架构。在空间维度上,室内环境及其不同的区域和连接路径自然可以用图来表示。这使得图神经网络(GNNs)成为理想的选择[25]。然而,路径表征需要模型透明度,这对于“黑盒”模型来说是一个已知的挑战。传统的可解释人工智能(XAI)方法,如局部可解释模型不可知解释(LIME)[26]和Shapley加性解释(SHAP)[27],并不适合GNNs。虽然它们可以评估输入对最终输出的贡献,但无法模拟输入之间的相互作用,而这对于量化扩散强度至关重要。它们依赖于对输入特征的独立扰动,这可能会破坏节点之间的相互依赖的拓扑结构,导致解释无效[28]。
为了解决这个问题,选择了图注意力网络(GAT)[29]。其注意力机制作为一种增强模型性能和提供可解释性的关键双重用途技术得到了系统的验证[30]。在环境科学的许多预测任务中,基于注意力的GNNs已被广泛用于提高预测性能,例如监测水质[31]、捕捉空间相似性以改进PM2.5预测[32]、预测未监测区域的空气质量[33],以及通过加权聚合邻居信息预测O?和NO?浓度[34]。其他研究将注意力机制直接用于可解释性分析,例如解释城市间的污染物扩散路径[35]、识别复杂空气污染中的互动城市集群[36],以及适应性优先考虑上游监测站的影响[37]。然而,这些应用主要集中在室外宏观环境(如城市和地区),尚未探索使用GAT的注意力机制来量化室内污染物扩散强度。
在时间维度上,IAQ数据的序列特性需要一个能够捕捉长期依赖性的模型。门控循环单元(GRU)因其已被证明的有效性和计算效率而被选为这一角色[38]。通过使用更新门和重置门,GRU可以选择性地过滤和保留历史信息,从而准确模拟污染物浓度的时间演变。
因此,为了填补上述研究空白,本研究的主要目标是开发并验证一个可解释的混合时空框架(X-GAT-GRU),作为表征相互连接的室内区域间动态污染物扩散路径的可解释工具。在这个框架中,首次将可解释的GAT应用于动态室内污染物扩散路径的定量分析。GAT的注意力权重被转换为一个动态指标,代表连接室内区域间的扩散影响。为了验证其在实际场景中的有效性,在一个有人居住的住宅进行了21天的案例研究,该时间段涵盖了春节,这是居住者活动和污染事件高发的时期。部署了一个低成本传感器网络来收集模型训练所需的数据,持续记录PM2.5浓度、温度和湿度,分辨率为每秒一次。同时,收集了包括门窗状态和手动维护的排放事件日志(如烹饪、吸烟)的上下文数据,以提供评估模型识别和表征污染物扩散路径能力的真实依据。