利用一个可解释的、基于注意力机制的时空建模框架来表征室内污染物动态扩散路径

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BUILDING AND ENVIRONMENT》：Characterizing dynamic indoor pollutant dispersion pathways using an interpretable attention-driven spatiotemporal modeling framework

【字体：大中小】 时间：2026年01月02日 来源：BUILDING AND ENVIRONMENT 7.6

编辑推荐：

　　本研究提出基于图注意力机制（GAT）与门控循环单元（GRU）的混合时空预测模型X-GAT-GRU，通过低成本传感器网络采集室内PM2.5浓度及环境数据，动态解析污染物扩散路径，验证模型在21天案例中R2达0.80，为主动式IAQ管理提供数据驱动的决策支持。

马瑞良|赵远|王莉|贾凌舒|郭忠吉|李国龙|黄涛|毛晓轩|高宏|马建民

甘肃省环境污染预测与控制重点实验室，兰州大学地球与环境科学学院，兰州730000，中国

摘要

室内空气质量（IAQ）的有效管理对公共卫生至关重要，但受到复杂且动态的污染物扩散路径表征挑战的阻碍。然而，目前缺乏简单高效的工具来表征和分析室内污染物扩散路径。为了解决这一难题，本研究开发了一个可解释的混合时空预测模型框架X-GAT-GRU，该框架结合了时空网络，并利用图注意力机制来学习室内扩散特性。为了评估该模型框架的分析和解释能力，在一个具有明确扩散路径的室内环境中进行了案例评估，模型数据来源于低成本传感器（LCS）。LCS网络以一秒的分辨率收集PM_2.5浓度、温度和湿度数据，同时记录门窗状态。结果显示，X-GAT-GRU模型在案例研究中的预测R²值为0.80。该模型还能够动态地描述房间间的污染物扩散路径，揭示了来自排放事件的污染物如何沿扩散路径传播，并受到建筑通风状态的影响，验证了物理浓度梯度与模型注意力权重之间的相关性。该模型框架利用数据驱动的方法分析建筑物内的污染物动态扩散路径，有助于将IAQ管理从被动响应转变为主动干预，例如在关键扩散节点策略性地添加空气净化器和通风设备。此外，该框架为分析可简化为拓扑网络的模型中的节点关系提供了一种新方法。

引言

保持最佳的室内空气质量（IAQ）对于保护公共卫生、减少空气传播疾病的传播以及提高居住者生产力至关重要[1]。由于现代人约90%的时间都在室内度过，室内环境已成为人类接触污染物的主要场所[2,3]。有效的IAQ管理依赖于在源头控制污染物、管理其扩散路径以及确保个人防护。然而，污染物扩散路径受到多种因素的复杂相互作用的影响，包括建筑布局[[4], [5], [6]]、通风条件[[7], [8], [9]]以及居住者活动[10,11]。鉴于这些复杂性，准确表征扩散路径是有效IAQ管理的基本挑战。

为了分析室内污染物扩散路径，已经提出了多种方法。实验方法（如示踪气体研究）为模型验证提供了宝贵的真实数据，但通常不适合连续分析[9,12]。统计方法（如核密度估计）已被开发用于从单一空间内的稀疏传感器数据重建高分辨率的污染物场[13]。然而，这些方法本质上仅适用于单个房间，因为它们基于距离的计算无法考虑墙壁等物理障碍。多区域网络模型（例如CONTAM [14]）将建筑物划分为多个区域，依靠质量平衡原理模拟房间间的复杂气流网络和污染物扩散[15]。然而，这些模型假设每个区域内完全混合，这在处理由热分层或局部通风引起的非均匀场时限制了其准确性[16]。计算流体动力学（CFD）模型可以提供高保真的三维气流模式和污染物浓度场表示，但其高昂的计算成本和对边界条件的敏感性限制了其在长时间、大规模场景中的应用[17,18]。

传统方法的局限性促使人们探索用于IAQ分析的数据驱动深度学习（DL）模型。尽管许多研究已成功使用DL模型进行室内污染物预测[[19], [20], [21], [22], [23], [24]]，但这些模型仅限于预测任务，而没有通过模型可解释性来分析污染物扩散路径。这揭示了一个关键的研究空白：需要一个既能准确预测又能分析真实居住环境中路径的DL框架。

为了解决这一空白，需要一种针对室内污染物扩散固有的时空特性的架构。在空间维度上，室内环境及其不同的区域和连接路径自然可以用图来表示。这使得图神经网络（GNNs）成为理想的选择[25]。然而，路径表征需要模型透明度，这对于“黑盒”模型来说是一个已知的挑战。传统的可解释人工智能（XAI）方法，如局部可解释模型不可知解释（LIME）[26]和Shapley加性解释（SHAP）[27]，并不适合GNNs。虽然它们可以评估输入对最终输出的贡献，但无法模拟输入之间的相互作用，而这对于量化扩散强度至关重要。它们依赖于对输入特征的独立扰动，这可能会破坏节点之间的相互依赖的拓扑结构，导致解释无效[28]。

为了解决这个问题，选择了图注意力网络（GAT）[29]。其注意力机制作为一种增强模型性能和提供可解释性的关键双重用途技术得到了系统的验证[30]。在环境科学的许多预测任务中，基于注意力的GNNs已被广泛用于提高预测性能，例如监测水质[31]、捕捉空间相似性以改进PM_2.5预测[32]、预测未监测区域的空气质量[33]，以及通过加权聚合邻居信息预测O?和NO?浓度[34]。其他研究将注意力机制直接用于可解释性分析，例如解释城市间的污染物扩散路径[35]、识别复杂空气污染中的互动城市集群[36]，以及适应性优先考虑上游监测站的影响[37]。然而，这些应用主要集中在室外宏观环境（如城市和地区），尚未探索使用GAT的注意力机制来量化室内污染物扩散强度。

在时间维度上，IAQ数据的序列特性需要一个能够捕捉长期依赖性的模型。门控循环单元（GRU）因其已被证明的有效性和计算效率而被选为这一角色[38]。通过使用更新门和重置门，GRU可以选择性地过滤和保留历史信息，从而准确模拟污染物浓度的时间演变。

因此，为了填补上述研究空白，本研究的主要目标是开发并验证一个可解释的混合时空框架（X-GAT-GRU），作为表征相互连接的室内区域间动态污染物扩散路径的可解释工具。在这个框架中，首次将可解释的GAT应用于动态室内污染物扩散路径的定量分析。GAT的注意力权重被转换为一个动态指标，代表连接室内区域间的扩散影响。为了验证其在实际场景中的有效性，在一个有人居住的住宅进行了21天的案例研究，该时间段涵盖了春节，这是居住者活动和污染事件高发的时期。部署了一个低成本传感器网络来收集模型训练所需的数据，持续记录PM_2.5浓度、温度和湿度，分辨率为每秒一次。同时，收集了包括门窗状态和手动维护的排放事件日志（如烹饪、吸烟）的上下文数据，以提供评估模型识别和表征污染物扩散路径能力的真实依据。

部分摘录

混合时空预测模型

本节详细介绍了用于分析室内污染物扩散的混合时空模型。该方法首先将室内环境抽象为拓扑图，以表示潜在的扩散路径。然后通过GAT处理该图，其注意力机制提供了一个可解释的矩阵，用于分析这些路径的动态影响。为了提高预测准确性，该模型与GRU结合使用，从而提高了其捕捉

数据集的时空复杂性

图2显示了来自七个监测点的1分钟重采样PM_2.5时间序列数据。数据集表现出显著的波动性，为评估模型性能提供了理想的条件。排除明显的峰值事件后，所有监测点的背景PM_2.5浓度大约在50 μg/m3范围内波动。在这个水平之上，可以识别出两种主要类型的峰值事件。

厨房节点经常经历短时间但高强度的PM_2.5峰值

限制和未来研究方向

将X-GAT-GRU模型置于更广泛的建模框架中是重要的。作为一种数据驱动的方法，它代表了现实的简化抽象。例如，图表示通过将房间定义为主要节点及其直接邻接关系定义为边来简化建筑系统，而识别出的特定扩散模式取决于这个特定案例住宅的特点。未来工作的一个关键领域是将该框架应用于更广泛的

结论

本研究的核心成就是一个可解释的混合时空建模框架X-GAT-GRU的成功开发和验证。该框架独特地将建筑物的互联网络与其历史动态相结合，主要目标是分析复杂的动态室内污染物扩散路径。通过注意力机制，该模型能够将抽象权重转换为可解释和动态的扩散路径度量

CRediT作者贡献声明

马瑞良：撰写——原始草稿、可视化、验证、方法论、正式分析、数据整理、概念化。赵远：撰写——审阅与编辑、验证、监督、软件、资源、调查、资金获取、概念化。王莉：撰写——审阅与编辑、监督、项目管理、调查。贾凌舒：数据整理。郭忠吉：数据整理。李国龙：数据整理。黄涛：监督。毛晓轩：监督。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号