利用气象变量,开发一种可解释的人工智能驱动模型,用于超细颗粒物(PM0.1)的预测与原因分析
《Environmental Challenges》:Explainable artificial intelligence-driven model for ultrafine particle (PM
0.1) prediction and explanation using meteorological variables
【字体:
大
中
小
】
时间:2025年07月30日
来源:Environmental Challenges CS8.0
编辑推荐:
PM0.1浓度预测与气象变量解释的XAI-集成模型研究。通过XGBoost优化和SHAP解释框架,实现R2达89%、MAE 0.28 μg/m3的高精度预测,并揭示温度、湿度等关键气象因子对PM0.1的影响机制,为城市空气质量决策提供可解释支持。
PM0.1,即直径小于0.1微米的超细颗粒物,是城市空气污染中一种极具危害性的污染物。这类颗粒物因其极小的体积,能够轻易穿透人体肺部,甚至进入血液并广泛分布在人体内,因此对健康的影响尤为严重。它与严重的呼吸系统疾病、心血管疾病等密切相关,对易感人群如患有慢性病或老年人尤为危险。由于PM0.1的健康危害性,如何有效地监测和解释其浓度变化,对于制定针对性的空气质量管理策略具有重要意义。
在这一背景下,研究者们开始探索基于机器学习(ML)的预测和解释方法,以提供更准确的空气质量信息,并帮助政策制定者和护理人员做出更加科学和及时的决策。传统的空气质量监测方法往往依赖昂贵的实验室设备和复杂的操作流程,难以满足实时性和普及性的需求。因此,开发一种结合多种计算智能技术的软计算框架,成为解决这一问题的可行路径。这种框架不仅能够实现对PM0.1浓度的准确预测,还能提供清晰的解释,使决策者能够理解其背后的原因。
本研究提出了一种新颖的软计算框架,该框架结合了多种计算智能技术,以提升对PM0.1浓度预测和解释的准确性与可解释性。其中,XGBoost(极端梯度提升)算法被选为核心模型,并通过贝叶斯优化进行超参数调整,以实现最优的预测性能。在实际应用中,该模型在未见数据上的表现尤为突出,达到了89%的R2值,意味着模型能够解释大部分的浓度变化。同时,其平均绝对误差(MAE)为0.28 μg/m3,根均方误差(RMSE)为0.38 μg/m3,显示出其在预测精度上的优越性。
为了进一步提升模型的可解释性,研究团队将SHAP(SHapley Additive exPlanations)方法引入到XGBoost模型中。SHAP是一种基于博弈论的解释方法,能够量化每个输入特征对模型预测结果的贡献,从而提供全球和个体层面的解释。通过这种方式,研究者能够揭示温度、湿度、风速等气象变量在PM0.1浓度变化中的相对重要性,为政策制定者提供可信赖的决策依据。
在数据采集方面,研究团队从泰国南部城市Hat Yai的气象站获取了基于六种核心气象变量(温度、相对湿度、大气压、PM2.5、风速和降水)的数据,并使用纳米颗粒采样器采集了PM0.1的真实浓度数据。这些数据被处理为标准格式,包括异常值检测和缺失值插值,以确保数据的准确性和可靠性。通过将这些数据集划分为训练集、验证集和测试集,研究团队能够对模型进行充分的训练和评估,从而提高其泛化能力。
在模型构建过程中,研究团队采用了一种基于增强算法的策略,特别是XGBoost算法。增强算法通过组合多个弱模型来构建一个强大的预测模型,这使得它们在处理复杂气象数据方面表现出色。为了进一步优化模型性能,研究团队还采用了随机搜索和贝叶斯优化两种超参数调整方法。这两种方法在不同的模型中表现出不同的效果,例如,贝叶斯优化在XGBoost模型中显著降低了误差,提高了预测精度。
在实验结果中,XGBoost模型在贝叶斯优化下表现最佳,达到了89%的R2值,显示出其在预测PM0.1浓度方面的卓越能力。同时,研究团队通过SHAP方法对模型进行了详细解释,揭示了气象变量对PM0.1浓度的影响。这些解释不仅包括全局特征重要性分析,还涵盖了具体事件中的个体影响,为决策者提供了更全面的信息支持。
研究结果表明,虽然LightGBM和XGBoost在预测性能上表现优异,但XGBoost在结合SHAP方法后,能够更准确地解释模型的预测结果,这使得其在空气质量管理中的应用更具实际意义。此外,研究团队还指出了当前模型在解释变量间因果关系方面的局限性,并建议未来研究应引入因果分析技术,如因果发现算法,以更深入地理解气象变量与PM0.1浓度之间的相互作用。
本研究的成果不仅为城市空气质量监测提供了新的技术路径,也为政策制定者和护理人员提供了更透明和可信赖的决策支持。通过将预测与解释相结合,该模型能够帮助识别导致PM0.1浓度变化的关键因素,从而制定更加精准的应对措施。未来的研究方向包括扩展模型输入特征,如交通密度、工业排放和土地利用等,以进一步提升模型的预测能力和实际应用价值。此外,结合因果分析技术,研究团队希望能够在更深层次上揭示PM0.1浓度变化的机制,从而为全球范围内的空气质量管理提供更加科学的依据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号