基于知识的深度学习方法用于减轻联合空气污染物预测中的偏差
《Environment International》:Knowledge-informed deep learning to mitigate bias in joint air pollutant prediction
【字体:
大
中
小
】
时间:2025年11月18日
来源:Environment International 9.7
编辑推荐:
物理信息神经网络框架实现多污染物高分辨率预测,整合大气扩散方程约束,显著降低系统偏差,提升空间可转移性,在NO?/NOx和PM?.?/PM??预测中分别减少21%-42%和16%-17%的偏差,通过联合训练和物理参数反演实现高效建模与可解释性预测。
空气污染预测在公共健康保护和环境管理中具有至关重要的意义。传统的机器学习(ML)方法在空间分辨率方面表现优异,但缺乏对物理化学过程的约束,导致系统性偏差,从而影响流行病学研究中的暴露估计。化学传输模型(CTM)虽然可以模拟大气物理过程,但需要昂贵的参数化处理,且通常无法捕捉局部尺度上的变化,这对健康影响评估至关重要。数据驱动方法的高精度与物理现实之间的差距,成为推动空气质量科学发展的主要障碍。为了解决这一挑战,我们提出了一种新型的物理信息深度学习框架,将对流扩散方程和流体力学约束直接整合到神经网络结构中,用于多污染物预测。该方法通过建模不同的地理区域中的污染物对(如加州的NO?/NO?,中国大陆的PM?.?/PM??),提供了一个全面的框架,用于在高分辨率下进行物理约束的大气建模。通过高效的框架,我们的方法表明,将代理对流和扩散场作为物理约束可以显著改变学习动态,减少系统性偏差,并提高计算效率。
在空气质量科学和公共健康研究中,系统性偏差直接转化为流行病学研究中的暴露分类错误,这可能导致健康效应估计的偏差和政策决策的失误。传统机器学习模型缺乏物理约束,因此可能生成不符合物理原理的预测(例如负浓度或质量守恒的违反),从而削弱模型输出的可信度。此外,纯粹统计模型的“黑箱”性质无法提供对基础物理过程的洞察,限制了其在理解污染动态和开发针对性缓解策略方面的实用性。
现代空气质量应用对模型提出了新的要求:高空间分辨率以进行暴露评估、计算效率以实现操作部署、物理一致性以确保在多样化的条件下获得可靠的预测,以及可解释性以支持科学理解和政策制定。现有的CTM和纯粹的机器学习方法都无法同时满足这些要求,因此迫切需要一种结合两者优势的混合方法,以克服各自固有的弱点。
我们提出的物理信息神经网络(PINN)方法在多个领域展现了巨大的潜力,通过将物理定律整合到深度学习模型中,从而增强模型的物理约束能力。PINN在流体动力学、热传递和波传播等领域的成功应用表明,这种方法能够有效地约束神经网络,使其符合控制方程。然而,将PINN应用于大气化学和空气污染建模仍处于初步探索阶段。最近的研究尝试使用图神经网络(GNN)来模拟大气化学机制和空气污染物估算,但面临显著的局限性:图网络的极高计算复杂性不利于大规模应用,无法直接整合基本的对流扩散过程,且无法提取可解释的物理场。这些限制突显了开发专门针对大气建模的更高效PINN架构的必要性。
为了应对这些关键问题,我们开发了一种新颖的物理信息深度学习框架,将基本的大气传输方程直接整合到神经网络架构中。该框架结合了以下特点:(1)通过嵌入的偏微分方程(PDE)明确执行对流扩散物理;(2)通过MLP架构而非复杂的图网络实现计算效率;(3)提取可解释的物理参数(模拟的流速场);(4)通过约束学习动态进行理论分析以减少偏差。该框架是第一个将大气流体力学原理与深度学习结合,实现高分辨率多污染物预测的高效整合方法,为空气质量建模提供了一种变革性的方法,同时实现了物理现实、计算效率和可解释性的平衡。
为了展示我们方法的广泛适用性,我们将建模框架应用于加州的州级高分辨率长期每周反应性NO?和NO?时间序列预测,以及中国大陆的国家日级惰性PM?.?和PM??时间序列预测。由于NO?包括NO?,PM??也包括PM?.?,因此这两种浓度对具有相似的层次关系(NO? < NO?;PM?.? < PM??),可以在框架中编码为约束。然而,除了这种包含关系外,NO?和NO?之间的物理和化学关系与PM?.?和PM??之间的关系差异显著。因此,我们为每种污染物对使用了不同的预测器和参数。
此外,我们还提取了NO?/NO?和PM?.?/PM??的模拟对流和扩散场,并对其时空变化进行了解释。我们还通过半监督方法数学推导了泛化误差的上界,并提供了PINN建模方法在独立测试中取得改进性能的理论依据。
在我们提出的模型中,我们借鉴了CTM的概念,但通过自动微分学习简化了流速、扩散系数等参数的参数化。单独的NO?浓度数据不足以生成这些未知参数的单一解,而在实践中获取这些参数数据是不可能的,且求解隐含物理的逆问题成本高昂。正如隐藏流体动力学模型所示,我们仅依靠观察到的浓度数据中的信息,就实现了对这些参数的代理值的高定量一致性。在这里,我们构建了一个物理信息深度神经网络来近似以下映射:输入数据包括气象、排放、地形和土地利用等信息,输出为污染物浓度。我们使用了代理流速场和扩散场来模拟污染物的对流和扩散过程,从而提高了模型的物理约束能力。
为了评估我们的物理信息框架在不同环境条件下的表现,我们选择了两个具有代表性的污染物对,分别来自地理上不同的区域:加州的反应性氮物种(NO?/NO?)和中国大陆的颗粒物(PM?.?/PM??)。这种双区域方法提供了不同的测试环境,包括不同的排放模式、气象条件、地形特征和监测网络特性。加州拥有高质量的辅助数据(如交通密度)和完善的监测基础设施,适合反应性气体建模,而中国大陆则具有复杂的国家尺度环境变化,适合测试颗粒物预测能力。
我们对模型的泛化误差进行了评估,这通常定义为模型在时空域内对未见地点的数据预测误差,包括估计偏差、方差和随机噪声。我们使用训练和测试样本推导了偏差,并利用所有数据(包括训练、测试和预测样本)推导了方差,从而得出泛化误差的估计。为了减少估计偏差,我们在模型中整合了PDE(偏微分方程)和额外的物理约束(如阈值约束和化学平衡关系),这有助于减少偏差并提高模型的泛化能力。通过这种整合,我们的方法在加州和中国大陆的测试中均表现出良好的性能。
我们的实验设计采用了严格的三层次采样策略,以评估预测准确性和空间泛化能力。我们分配了81%的采样地点用于模型开发,分为训练(78%)和常规测试(22%)数据,剩下的19%专门用于站点独立测试。空间-时间分层使用了行政区域(加州的县,中国大陆的省)和季节作为综合分层因素,以确保在不同的环境条件下具有代表性。这种分区设计解决了空气质量建模中的一个关键限制:传统的随机交叉验证通常通过在训练和测试集之间包含空间相关样本来高估模型性能。我们的站点独立测试使用了完全不同的监测地点,从而提供了真实的空间转移能力评估。样本比例接近统计学习理论中建立的最优抽样分配(0.368)。
我们选择了R2(决定系数)和RMSE(均方根误差)作为互补的评估指标,因为它们具有不同的分析优势。RMSE量化了预测误差的绝对大小,并且对系统性偏差敏感,而R2衡量了解释方差,并指出了预测与观测之间的相关性强度。这种指标组合具有双重分析目的:量化预测准确性,并通过性能差异分析检测系统性偏差。关键的诊断指标是常规测试(与训练数据空间相关)和站点测试(空间独立)之间的性能差距。较大的差异信号系统性偏差和较差的泛化能力——这是纯粹数据驱动方法的常见问题。相反,一致的性能表现表明模型具有良好的空间转移能力。这种评估框架符合环境建模研究中的既定标准,同时为评估模型可靠性提供了更高的严谨性。
在加州的NO?和NO?预测中,我们的方法在站点独立测试中取得了前所未有的准确度(R2: 0.95–0.96;RMSE: 1.57 ppb for NO?;3.95 ppb for NO?),显著优于传统深度学习方法(R2: 0.53–0.75)。由于现有研究在时间分辨率(每日 vs. 每周)、空间覆盖和验证方法上的显著差异,直接性能比较并不合适。加州地区先前的研究(如Ross et al., 2006;Karner et al., 2010;Di et al., 2019;Yu et al., 2023;Lee et al., 2023)报道了不同的性能水平(R2: 0.76–0.91),但这些研究使用了不同的时空尺度和验证方法。我们的结果表明,jPINN框架能够在我们特定的每周预测框架中有效建模NO?和NO?之间的物理化学相互作用,从而实现更稳定的学学习动态和更高的泛化能力。
除了预测精度外,我们的方法还提供了两种关键优势:明确整合物理约束和增强的机制可解释性。例如,虽然Wei et al. (2019) 使用空间-时间极端随机树(STET)对PM?.?预测取得了相似的性能,但基于树的方法可能会产生不连续的预测(Li et al., 2020a),这可能会违反大气传输中固有的连续性属性。更重要的是,我们的框架能够同时提取控制对流和扩散过程的可解释物理参数——这是传统方法中缺乏的,传统方法通常以牺牲物理理解为代价换取高预测性能。
我们的方法通过同时生成对流和扩散的代理场,以及配对空气污染物浓度表面,代表了深度学习与大气科学交叉领域的重大方法论进步。虽然这些代理场主要作为PINN框架内逆问题的数学代理以减少偏差和降低泛化误差,但它们超越了单纯的计算副产品,成为理解大气传输现象的宝贵诊断工具。通过分析2015年4月15日中国大陆北部发生的严重沙尘暴事件,我们揭示了不同颗粒物粒径之间的传输机制差异:PM??主要通过来自外蒙古的长距离对流传输,由大尺度气象因素(罗斯贝波)驱动,而PM?.?表现出根本不同的时空模式,主要由本地排放源和二次形成过程控制。这种对粗粒和细粒颗粒物传输机制的观察结果引发了关于不同粒径颗粒物污染控制统一监管措施有效性的深刻问题,并强调了针对这些污染物不同物理行为制定针对性干预策略的必要性。
我们进一步证明,整合额外的基于物理的正则化器(如阈值约束、化学平衡关系和质量守恒原理,这些正则化器由残差e?-e?表示)到损失函数中,引入了互补的正则化机制,共同最小化泛化误差。对于高分辨率浓度表面预测,我们的方法采用了一种特别高效的无网格方法:等待预测的网格点同时作为无监督样本在我们的半监督学习框架中,这强化了物理约束,如质量守恒,防止了不合理的浓度梯度。这一数学框架揭示了将物理原理整合到深度学习架构中的根本优势——它们有效地将假设空间限制在物理可实现的解中,从而在环境监测网络固有的时空异质性下产生稳健的泛化模型。
我们的jPINN框架在保持与图神经网络方法相当或更好的预测性能的同时,表现出更高的计算效率。与我们之前基于图神经网络的实现(Li et al., 2023)相比,我们使用更简单的双全残差网络代替计算密集的图卷积操作,取得了相似的站点独立测试性能(PM?.?: R2 0.88 vs. 0.87;PM??: R2 0.87 vs. 0.85)。对于加州的NO?和NO?预测,我们的jPINN方法略优于单独的图神经网络(R2 = 0.95–0.96 vs. 0.93–0.94),在提高准确性的同时减少了计算复杂性。这一效率优势在我们的计算分析中得到量化(补充表S4):虽然我们的训练时间比基准机器学习模型(NO?/NO?: ~1.5小时,PM?.?/PM??: ~3.5小时)更长,但仅需图神经网络训练时间的7%–9%就能实现优越的性能。完整的集成训练(100个模型)需要6.25天(NO?/NO?)和14.3天(PM?.?/PM??),使得该框架在计算资源有限的环境中也具备可行性。除了计算优势外,我们的物理信息方法还提供了关键的科学益处,确保模型系统性与流体动力学原理一致,并保持物理有意义的预测。与可以生成不连续或物理上不可能结果的黑箱机器学习模型不同,我们的方法明确模拟了对流和扩散过程,使科学家能够理解污染模式的物理驱动因素,同时使政策制定者能够基于机制洞察开发针对性的缓解策略。该框架在不同数据分辨率下保持竞争力——在高分辨率协变量下实现更高的准确性,即使在粗分辨率PM?.?/PM??数据下也保持物理可解释性。鉴于环境建模中物理一致性的关键重要性以及对健康影响评估和政策制定日益增长的可靠空气污染预测需求,该方法的计算开销是值得的,因为它显著提高了科学严谨性和实际应用价值。
虽然Transformer在序列数据处理方面表现出色,但它们并不适合我们的时空预测应用,因为我们的数据集由不规则的时空采样点组成,而不是结构化的时序数据,使得序列到序列建模不适用。与传统的时序预测不同,我们的目标是使用稀疏、不规则分布的测量数据,估算空气污染物在任意时空坐标下的浓度。我们的灵活jPINN框架通过半监督方法特别解决了这些挑战,该方法自然处理不规则数据样本中的时间索引,并明确整合对流和扩散物理以模拟空气污染物的底层时空演变。这种方法比基于Transformer的序列建模更适合时空插值任务,后者依赖于时间模式而非物理传输机制。然而,我们利用了Transformer的核心技术——注意力机制——在我们的网络架构中,以动态加权影响因素的贡献并增强空气质量评估模型的性能。
总之,这项研究展示了物理信息深度学习框架在空气质量预测中的强大能力,特别是在需要高空间分辨率、物理可解释性和在数据有限地区稳健预测的应用场景中。通过将物理约束与数据驱动方法相结合,我们的方法在减少估计偏差、提高模型的泛化能力和解释性方面表现出色,为环境建模提供了新的思路和工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号