融合卫星遥感与机器学习预测台湾地区PM2.5离子组分时空分布的理论引导模型研究

【字体: 时间:2025年07月17日 来源:Science of The Total Environment 8.2

编辑推荐:

  本研究针对PM2.5离子组分时空预测难题,创新性整合土地利用回归(LUR)、XGBoost机器学习与SHAP解释技术,构建了台湾地区8种PM2.5离子(Na+、SO42?等)的高精度预测模型(调整R2达0.69-0.87),揭示了气溶胶酸度关键影响因素,为环境健康研究提供新范式。

  

随着城市化进程加速,PM2.5污染已成为威胁公众健康的重大环境问题。其中水溶性离子组分不仅直接引发气道炎症等急性健康效应,还通过调节气溶胶酸度影响大气能见度和二次有机气溶胶形成。然而传统化学传输模型(CTM)存在算法局限,而单纯机器学习(ML)又缺乏物理解释性,如何精准预测PM2.5离子时空分布成为环境科学领域的难点。

台湾地区的研究人员创新性地提出理论引导型研究方法,整合多源数据构建预测模型。通过收集台湾28个空气质量监测站2019-2021年8种PM2.5离子(Na+、NH4+、K+、Mg2+、Ca2+、Cl?、NO3?和SO42?)月度观测数据,结合WRF气象模型模拟数据、Himawari-8卫星气溶胶光学厚度(AOD)及土地利用信息,采用三阶段建模策略:首先基于专家知识筛选土地利用回归(LUR)特征变量,继而应用极端梯度提升(XGBoost)算法建模,最后采用SHAP可解释性分析揭示特征影响机制。

关键技术包括:1) 多源数据融合技术整合地面监测、卫星遥感和数值模拟数据;2) 理论引导的LUR-XGBoost混合建模框架;3) SHAP解释性分析量化各环境因子贡献度。研究特别采用10折交叉验证和独立测试集验证,确保模型可靠性。

【Ground-based observations】部分显示,台湾地区PM2.5月均浓度为14.89±7.56 μg/m3,其中SO42?占比最高(3.18±1.30 μg/m3),Mg2+最低(0.08±0.05 μg/m3)。

【Identification of ions in PM2.5】通过特征工程筛选出关键预测变量,包括卫星反演的PM2.5类型、土地利用类型、气象参数等。模型对多数离子表现出良好预测性能,其中SO42?调整R2达0.87,而Mg2+和Cl?预测精度较低。

【Conclusion】指出该研究突破传统ML"黑箱"局限,首次实现LUR与XGBoost的优势互补:LUR确保特征选择的物理合理性,XGBoost捕捉复杂非线性关系,SHAP则提供环境机制解释。模型成功揭示二次无机气溶胶(SIA)形成过程中气象条件与人为排放的交互作用,为制定精准减排策略提供科学依据。

这项发表于《Science of The Total Environment》的研究开创性地建立了环境科学与人工智能的交叉研究范式,其理论引导型ML框架不仅适用于PM2.5组分研究,也为其他环境污染物建模提供了可借鉴的方法论。特别值得注意的是,研究证实卫星衍生参数对SO42?预测贡献度达32%,凸显了地球观测技术在环境健康研究中的巨大潜力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号