基于注意力机制增强随机森林模型的多污染物协同估算方法研究

【字体: 时间:2025年06月17日 来源:International Journal of Applied Earth Observation and Geoinformation 7.6

编辑推荐:

  为解决多污染物协同估算中忽略相互作用及依赖关系的技术难题,研究人员开发了基于注意力机制增强的随机森林模型(MPA-RF),实现了PM2.5 、PM10 、O3 等六种污染物的同步高精度估算(R2 达0.74-0.93),较单任务模型提升9%-26%,为区域污染协同治理提供新范式。

  

随着中国城市化进程加速,京津冀、长三角和粤港澳大湾区等城市群面临严峻的复合型大气污染挑战。传统地面监测站点虽能提供精确数据,但存在时空不连续的固有缺陷;而现有卫星遥感估算模型多聚焦单一污染物,忽视污染物间复杂的相互作用和时空依赖性,导致协同治理缺乏科学依据。更棘手的是,物理模型依赖排放清单等先验知识,计算成本高昂;而常规机器学习模型在捕捉多污染物关联特征时表现乏力。

香港理工大学的研究团队创新性地将注意力机制与随机森林相结合,开发出MPA-RF模型。该研究利用Himawari-8卫星的可见光/热红外波段观测数据,融合ERA-5气象再分析资料和地面监测数据,在三大城市群实现了六种污染物(PM2.5
、PM10
、O3
、NO2
、CO、SO2
)的同步估算。论文发表于《International Journal of Applied Earth Observation and Geoinformation》,其核心突破在于:通过自注意力机制优化多输出随机森林的特征权重分配,并利用多头自注意力捕捉污染物间的时空依赖关系,最终构建出兼顾精度与效率的协同估算框架。

关键技术包括:1) 基于Advanced Himawari Imager(AHI)的16波段多光谱数据预处理;2) 融合GEOS-CF化学预报数据构建历史污染物序列;3) 采用站点交叉验证和空间交叉验证双评估体系;4) 通过GridSearch CV优化模型超参数。

研究结果显示:在模型性能方面,样本验证的R2
达0.81-0.93,其中PM2.5
表现最佳(R2
=0.93,RMSE=9.55μg/m3
)。空间验证中沿海站点因海陆风影响精度稍降,但整体仍保持0.74-0.92的R2
。与传统单任务模型对比,MPA-RF的R2
提升达9%-26%,训练效率提高40%以上。

时空分布分析揭示了显著的区域差异:京津冀地区冬季PM2.5
浓度超150μg/m3
,主要源于燃煤供暖;而粤港澳大湾区臭氧峰值出现在秋季,与夏季海洋气团抑制光化学反应有关。典型案例追踪显示,该模型能精准捕捉长三角地区沙尘事件中PM10
的日间扩散过程(>300μg/m3
→消散)和珠三角臭氧午后爆发性增长(60→200μg/m3
)的动态演变。

该研究的创新价值在于:首次将注意力机制引入随机森林实现多污染物协同估算,突破传统模型"各自为政"的局限;建立的2km/小时级高分辨率数据集,为解析污染交互机制提供新工具;提出的"卫星观测-历史序列-气象要素"多维特征融合框架,显著提升痕量气体(如SO2
)的估算精度。未来研究可进一步结合大气化学传输模型,从物理机制层面深化对污染物相互作用的理解。这项成果不仅为区域联防联控提供技术支撑,其方法论对全球其他大都市区的空气质量管理也具有重要借鉴意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号