
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于条件扩散模型的臭氧浓度生成式插补与预测方法
【字体: 大 中 小 】 时间:2025年07月03日 来源:Journal of Hazardous Materials 12.2
编辑推荐:
为解决地面臭氧监测数据缺失影响预测精度的问题,研究人员提出SSSD-Transformer模型,结合结构化状态空间扩散(SSSD)与Transformer架构,通过注入多源条件信息实现臭氧序列的高精度插补与预测。实验表明该方法在MCAR/MAR/MNAR三种缺失场景下均优于传统方法,预测稳定性随周期延长保持良好,为环境治理提供可靠数据支撑。
近年来,中国通过环境治理政策显著改善了空气质量,但臭氧(O3)污染问题日益突出。2024年上半年,全国339个城市O3平均浓度达147 μg/m3,北京同比上升11.4%至195 μg/m3。臭氧污染不仅威胁人体健康,其监测数据的高缺失率(由传感器故障、系统不稳定等导致)更严重影响预测模型效能。传统插补方法如均值填充或数据删除忽视气象与污染物关联规律,而物理模型WRF-CMAQ等依赖高成本排放清单。如何实现高精度数据修复与预测成为环境科学领域的关键挑战。
针对这一难题,中国某研究团队在《Journal of Hazardous Materials》发表研究,提出SSSD-Transformer生成式模型。该方法创新性地将空气质量指数(AQI)、污染物指标和气象数据作为条件信息注入扩散模型框架,联合结构化状态空间模型(SSSD)处理长程依赖与Transformer捕捉细节模式。研究采用北京地区2019-2022年监测数据,构建包含MCAR(完全随机缺失)、MAR(随机缺失)、MNAR(非随机缺失)三种场景的测试集,通过R2、MRE等指标评估性能。
主要技术方法
研究整合扩散模型的逐步去噪机制与SSSD的线性复杂度优势,设计双分支噪声预测网络:SSSD分支通过状态方程建模臭氧时间趋势,Transformer分支分析多源条件信息的非线性交互。训练阶段采用马尔可夫链逐步添加高斯噪声,推理时通过条件引导生成完整序列。数据来源于北京市35个监测站点的O3、NO2等6项污染物及温度、湿度等8项气象参数。
研究结果
结论与意义
该研究首次实现臭氧序列的生成式联合插补与预测,通过SSSD-Transformer框架有效融合物理规律(如O3-NOx光化学平衡)与数据驱动特征。环境启示部分强调,模型输出的完整序列可支持精准溯源分析,例如识别京津冀地区O3传输路径。方法论层面,加权组合策略(SSSD权重0.63±0.05,Transformer权重0.37±0.03)为多模态时间序列建模提供新范式。研究获国家重点研发计划(2023YFB3308903)支持,成果已应用于北京市生态环境局臭氧预警系统。
生物通微信公众号
知名企业招聘