一种用于中国长三角地区氧气(O3)预测与解释的混合深度学习模型

《Science of The Total Environment》:A hybrid deep learning model for O 3 forecasting and explaining in the Yangtze River Delta Region of China

【字体: 时间:2025年11月15日 来源:Science of The Total Environment 8

编辑推荐:

  臭氧浓度预测与可解释性分析:基于随机森林校正的地理加权回归和注意力机制序列模型,结合气象参数与污染物特征,通过LRP方法量化各因素贡献,揭示时空动态关联与源解析机制。

  本文探讨了如何利用可解释人工智能(XAI)方法,特别是分层相关性传播(Layer-wise Relevance Propagation, LRP)技术,来解析基于深度学习的臭氧(O?)预测模型中的内在机制。研究聚焦于中国长江三角洲(Yangtze River Delta, YRD)地区,通过生成高分辨率的臭氧浓度网格数据,结合气象参数和地面观测数据,构建了一个基于注意力机制的序列到序列(seq2seq)模型,以预测未来24小时、48小时和72小时的臭氧浓度。此外,研究还通过分析不同风向来源的潜在污染源贡献函数(Potential Source Contribution Function, PSCF)值和工业区位置,揭示了臭氧污染源在不同时间尺度上的动态变化及其影响。

臭氧作为一种二次污染物,主要在对流层中通过挥发性有机化合物(VOCs)、氮氧化物(NO?)以及羟基(OH)和过氧化氢基(HO?)等自由基的光化学反应形成。它不仅对人类健康和植被构成威胁,还对温室气体引发的气候变化有显著影响。臭氧浓度的变化受到多种因素的共同作用,包括人为前体物排放、气象条件、区域传输和去除过程。例如,干沉降作为臭氧传输过程中的主要去除机制,受到地表特性和大气属性的影响。这种机制使得臭氧污染在不同区域和时间尺度上的传播具有复杂性。

为了更好地理解臭氧污染的形成机制和传输路径,研究引入了深度学习方法,如循环神经网络(RNN)、长短时记忆网络(LSTM)和门控循环单元(GRU)。这些模型在空气污染预测中表现出色,但其在处理长时序输入数据时仍存在一定局限性。为此,研究采用了一个基于注意力机制的seq2seq模型,通过编码器-解码器结构,将输入序列映射到输出序列,从而更有效地捕捉臭氧浓度的长期依赖关系。注意力机制能够动态地聚焦于序列中的关键信息,赋予不同时间点不同的权重,有助于模型更好地理解臭氧污染的时空演化。

研究采用了随机森林(Random Forest, RF)方法对臭氧浓度进行校正,生成9公里分辨率的网格数据。这种数据不仅填补了未监测区域的空白,还为seq2seq模型提供了丰富的输入特征。通过分析不同年份和小时尺度下的贡献比例,结合风向和后向轨迹分析,研究揭示了网格特征、气象特征和污染物特征对臭氧浓度预测的影响。结果显示,对于24小时预测,网格特征的贡献比例为24.6%,气象特征为38.2%,污染物特征为17.0%。在下午13点至15点期间,这些比例分别上升至30.0%、35.0%和15.3%,与午间光化学反应和有利气象条件下的区域传输相一致。

此外,研究还通过整合潜在源贡献函数(PSCF)值和工业区位置,评估了不同风向来源对臭氧浓度的影响。这种分析方法有助于识别臭氧污染源在不同时间尺度上的变化,以及其对监测站点的贡献。研究发现,网格特征的贡献在一定程度上解释了臭氧来源在不同风向下的影响,为臭氧污染源的识别和传输机制的分析提供了新的视角。

在数据方面,研究收集了130个监测站点的每小时数据,这些站点分布在长江三角洲地区及其周边。数据涵盖了六种空气污染物的浓度,包括PM2.5、PM10、NO2、SO2、CO和O3,时间范围从2020年1月1日至2023年12月31日。这些监测站点的污染物记录在2020至2023年间保持了95%以上的有效性。通过使用反距离权重(IDW)、RF_D、RF_M和RF_A方案,研究评估了不同特征在臭氧浓度预测中的重要性,并揭示了地形、气象条件和植被类型对臭氧浓度的影响。

在评估随机森林校正模型的性能时,研究发现RF_A方案在结合地形和气象特征后,能够更有效地生成臭氧浓度的时空数据。这为后续的seq2seq模型提供了高质量的输入,从而提高了臭氧预测的准确性。同时,通过应用LRP方法,研究能够解析不同特征对臭氧浓度预测的影响,揭示了臭氧污染源在不同时间尺度上的动态变化。这种方法不仅有助于理解臭氧浓度的变化机制,还为制定针对性的空气质量管理策略提供了科学依据。

研究的主要贡献在于,通过结合XAI方法和深度学习模型,提供了一种新的视角来分析臭氧污染的形成和传输机制。这不仅有助于识别臭氧污染源的时空分布,还为理解不同气象条件和排放模式对臭氧浓度的影响提供了重要信息。此外,研究还通过分析不同风向来源的贡献,揭示了区域传输在臭氧污染中的作用,为制定区域性的污染控制措施提供了支持。

在方法论上,研究采用了一种系统化的框架,首先利用随机森林模型生成高分辨率的臭氧浓度网格数据,然后将这些数据与气象参数和地面观测数据结合,输入到基于注意力机制的seq2seq模型中进行预测。通过应用LRP方法,研究能够量化不同特征对臭氧浓度预测的影响,揭示了臭氧污染源在不同时间尺度上的动态变化。这种方法不仅提高了臭氧预测的准确性,还增强了模型的可解释性,为理解臭氧污染的形成机制和传输路径提供了新的工具。

研究的实践意义在于,通过提供高分辨率的臭氧浓度网格数据,填补了未监测区域的空白,为区域性的空气质量监测和管理提供了数据支持。同时,通过分析不同特征对臭氧浓度的影响,揭示了臭氧污染的复杂性,为制定针对性的污染控制措施提供了科学依据。这种方法在实际应用中具有广泛的适用性,不仅适用于臭氧污染的预测,还可以推广到其他空气污染物的分析中。

综上所述,本文通过结合XAI方法和深度学习模型,提供了一种新的视角来解析臭氧污染的形成机制和传输路径。研究不仅揭示了臭氧污染源在不同时间尺度上的动态变化,还为制定针对性的空气质量管理策略提供了科学依据。这种方法在实际应用中具有广泛的适用性,为理解和控制臭氧污染提供了重要的技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号