基于RF-CNN级联模型的斯里兰卡PM2.5 浓度时空预测:低污染地区卫星遥感与低成本传感器融合新策略

【字体: 时间:2025年06月10日 来源:Journal of Hazardous Materials Advances 5.5

编辑推荐:

  针对斯里兰卡PM2.5 监测数据稀缺问题,研究人员创新性提出RF-CNN级联模型,结合PlanetScope卫星影像(3m/像素)与24个低成本传感器数据,通过KNN填补缺失值,实现日均PM2.5 预测(NRMSE 32.4%,Pearson r 0.873)。该研究为低污染地区空气质量监测提供了可扩展解决方案。

  

空气污染已成为全球公共卫生的重大威胁,其中细颗粒物PM2.5
(空气动力学直径≤2.5微米的颗粒)尤其危险。尽管南亚是全球空气污染最严重的地区之一,斯里兰卡的PM2.5
水平相对较低,但仍超过世界卫生组织标准。更复杂的是,该国面临跨境污染和季节性波动,现有监测网络却因高成本设备难以密集部署。传统统计模型难以捕捉PM2.5
的非线性时空特征,而深度学习模型虽表现优异但计算成本高昂。如何利用有限监测数据实现高精度预测,成为亟待解决的难题。

针对这一挑战,由Duke University等机构组成的研究团队在《Journal of Hazardous Materials Advances》发表研究,创新性地将随机森林(RF)与卷积神经网络(CNN)级联,构建了适用于低污染地区的PM2.5
预测系统。研究整合了24个低成本TSI BlueSky传感器网络数据(2012-2024年)、四波段PlanetScope卫星影像(3m分辨率)及气象参数,通过K最近邻(KNN)算法填补数据缺失,最终在1934组数据上验证了模型性能。

关键技术包括:1)基于KNN(k=5)的时空特征缺失值填补;2)RF模型优化(600棵决策树,最大深度10)处理温度、湿度等气象参数;3)ResNet50架构提取卫星图像空间特征;4)引入稳定因子(Stabilizing Factor, SF=0.1)协调RF与CNN输出权重;5)创建输入数据质量评分(IDQS)和测试数据质量评分(TDQS)量化数据可靠性。

【研究结果】
2.1 地面PM2.5
数据采集
24个监测站数据显示PM2.5
平均浓度15μg/m3
,KNN填补后数据分布保持一致性(图3)。训练集(17站)与测试集(7站)覆盖全气候带,确保模型泛化能力。

2.2 卫星影像处理
筛选224×224像素、云量<10%的清晰影像,剔除阴影干扰(图4)。每站1km2
范围内多时段影像增强了时空敏感性(图5)。

2.5 RF-CNN管道
• RF组件:MSLP(平均海平面压力)成为最关键分裂特征,但单独预测误差较高(NRMSE 55.9%)。
• CNN组件:通过15个时空特征(含7天滞后值、人口密度等)提升空间预测,空间相关系数达0.978。
• 级联优化:SF=0.1时性能最佳,测试集NRMSE降至32.4%,MAE 3.318μg/m3
(表4)。站点层面,Kurunegala预测最准(NRMSE 25.7%),Katubedda误差最大(33.1%)(表5)。

3.3 数据填补影响
IDQS>6.75时模型表现稳定(图11),证实KNN填补在允许范围内(≤6个缺失点/天)的有效性。

3.4 卫星影像敏感性
同一天不同时段影像导致预测波动(平均偏差7.99%),暖色调和阴影区域影响显著(图12)。

【结论与意义】
该研究首次实现了斯里兰卡全境PM2.5
的亚公里级预测,其创新点在于:1)用低成本传感器网络(350/站)替代传统监测站(4500/站);2)通过RF误差校正和CNN空间特征提取的协同作用,在低浓度区域(15μg/m3
)取得与高污染地区相当的预测精度;3)提出的IDQS/TDQS体系为数据质量控制提供量化标准。

局限性包括卫星影像预处理依赖人工、季节性数据覆盖不足等。未来可通过自动云检测算法、多污染物联合预测扩展应用。该框架特别适合监测资源匮乏地区,为制定精准治污策略提供科学依据,例如识别跨境污染传输路径或评估局部排放源影响。研究团队建议建立长期观测网络,结合无人机影像和动态气象特征,进一步提升模型适应气候变化的能力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号