随着工业化进程加速,全球臭氧污染问题日益严峻。地表臭氧(O3)作为继PM2.5之后对人类健康威胁最大的空气污染物之一,其浓度在全球多个地区呈现上升趋势。特别是在印度、尼日利亚、巴基斯坦等地区,2010至2020年间臭氧浓度显著增加。一项针对全球45个特大城市的评估显示,其中35个城市经历了臭氧浓度上升。臭氧暴露会显著增加呼吸系统疾病、心血管疾病风险,诱发慢性阻塞性肺疾病,甚至导致过早死亡。日益严重的臭氧污染对人类健康构成了持续威胁。然而,当前全球地表臭氧监测面临重大挑战。地面监测站虽然精度高、时间连续性强,但全球分布极不均衡,北美、欧洲和东亚地区站点密集,而其他区域覆盖稀疏。卫星遥感虽能提供大范围观测,但由于平流层臭氧层干扰,边界层臭氧仅占大气总臭氧不足10%,卫星难以直接准确监测地表臭氧浓度。现有全球臭氧数据集多为月尺度或年尺度,如Liu等发布的0.5°月尺度数据集和Delang等开发的0.1°年尺度数据集,这些粗时间分辨率数据平滑了臭氧污染信息,难以捕捉突发污染事件和详细变化趋势,限制了健康评估研究的深入开展。在此背景下,武汉大学王锐团队在《Scientific Data》发表了题为"A global land daily 10-km resolution surface ozone dataset from 2013-2022"的研究,开发了2013-2022年全球陆地每日最大8小时平均(MDA8)地表臭氧浓度数据集,空间分辨率达0.1°×0.1°。该研究采用高效的LightGBM(Light Gradient Boosting Machine)算法,融合了地面臭氧观测、大气化学模型模拟、气象再分析数据、卫星产品、排放清单等多源数据,实现了高精度全球地表臭氧浓度估算。
关键技术方法包括:从TOAR(Tropospheric Ozone Assessment Report)、CNEMC(China National Environmental Monitoring Center)等全球6,193个监测站获取臭氧观测数据;采用CCMI(Chemical Climate Modeling Initiative)四个大气化学模型(CHASER MIROC-ESM、MRI、GEOSCCM、MOCAGE)的模拟数据;整合ERA5和MERRA-2气象再分析数据;利用OMI(Ozone Monitoring Instrument)卫星的OMTO3e和OMNO2d产品;结合EDGAR(Emissions Database for Global Atmospheric Research)排放清单、MODIS(Moderate Resolution Imaging Spectroradiometer)土地覆盖数据等。通过严格的质量控制、时空特征优化和多种交叉验证方法,确保数据可靠性。数据生成框架研究构建了完整的数据处理流程,包括数据预处理、模型构建和验证三个主要阶段。在数据预处理阶段,对图像数据进行空间分辨率统一重采样至0.1°,时间分辨率统一为日尺度;对地面观测数据进行异常值剔除、单位统一(μg m-3)和时区标准化(UTC+0)。小时臭氧观测数据转换为MDA8浓度,定义有效值为至少包含6小时有效观测的8小时平均值,且每日需至少18个有效8小时平均值。观测数据按0.1°网格进行平均,作为机器学习模型标签。