
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于高斯过程的街道级NO2浓度实时预测模型构建与敏感性分析
【字体: 大 中 小 】 时间:2025年06月21日 来源:Science of The Total Environment 8.2
编辑推荐:
推荐:为解决城市街道级NO2污染精准监测难题,伦敦研究人员利用225个低成本传感器网络数据,结合高斯过程(GPs)模型,开发了融合街道几何与网络特征的实时预测框架。研究发现街道宽度、介数中心性和长度主导81%的浓度变异,模型平均绝对误差仅7.31 μg/m3,为超局部空气质量管理提供可扩展解决方案。
空气污染已成为全球公共卫生的重大威胁,世界卫生组织数据显示99%人口暴露于超标污染物中,其中氮氧化物(NO2)与呼吸系统疾病、心血管疾病等密切相关。传统监测设备虽精度高但成本昂贵,难以实现高密度布设;而新兴的低成本传感器(LCS)虽能提升空间覆盖率,却面临数据质量不稳定的挑战。如何在有限传感器支持下精准预测整个城市网络的污染分布,成为环境科学领域的核心难题。
伦敦的研究团队选择卡姆登区作为研究对象,这里部署了225个间距约200米的AirNode传感器网络。研究创新性地将高斯过程(GPs)这一非参数贝叶斯方法与街道物理特征相结合,通过构建包含街道几何参数(宽度W、高度H、长度)、网络指标(介数中心性CB、度中心性CD)等特征的空间模型,实现了对未监测街道NO2浓度的实时预测。
研究采用三大关键技术:1) 基于LIDAR的街道几何特征提取算法,通过边缘检测确定峡谷宽度与高度;2) 基于图论的网络中心性计算,量化道路在交通流中的重要性;3) 马特恩核函数(ν=1/2)优化的高斯过程回归,处理空间不连续性数据。数据来自2022年3月至2023年2月的传感器网络,重点关注12月异常活动期的30分钟间隔数据。
【传感器网络与数据预处理】
研究首先对原始传感器数据进行时空对齐处理,采用15分钟滑动窗口填补缺失值,并通过实验室与现场混合校准法(EASE)将传感器误差控制在±5 μg/m3。数据矩阵Y∈?n×q的行代表n个传感器,列记录q个时间点的NO2浓度,形成时空观测网络。
【道路网络特征工程】
通过英国地形测量局(OS)获取矢量路网数据,采用节点简化算法消除冗余交叉点,构建包含3000条街道的拓扑网络。利用数字表面模型(DSM)提取建筑高度,定义街道峡谷的W/H比为关键形态参数。网络中心性指标中,介数中心性CB(衡量最短路径通过频率)被证明比度中心性更具预测价值。
【模型优化与敏感性分析】
通过霍夫丁-索博尔分解发现:街道宽度单独解释55%的NO2浓度变异,介数中心性(18%)和道路长度(8%)分列二三位。三者组合可解释81%的方差(不考虑交互作用),而道路功能分类贡献度仅0.31%,因其信息已被其他特征覆盖。采用ν=1/2的马特恩核模型在测试集上表现最优,RMSE为7.9 μg/m3,显著优于平滑核函数。
【实时预测与不确定性量化】
最终模型仅保留宽度、介数中心性和长度三个特征,在12月预测中实现7.31 μg/m3的平均绝对误差。模型成功将传感器覆盖范围从5.08%的路网扩展至70.3%的低不确定区域(σX? < mean(σ))。预测显示,凌晨2点浓度分布最集中(σ=5.01 μg/m3),反映人类活动规律对模型精度的影响。
这项研究首次系统量化了城市形态特征对NO2分布的影响权重,为"传感器稀疏+路网稠密"场景提供了通用建模框架。其核心价值在于:1) 揭示街道几何参数比传统交通指标更具预测力;2) 开发的轻量化模型仅需3个特征即可保持较高精度;3) 不确定性量化体系支持政策制定者识别高可信度区域。局限性在于传感器误差会压缩预测方差,未来需结合交通流量等动态特征提升模型灵敏度。该成果发表于《Science of The Total Environment》,为智慧城市环境监测提供了可扩展的技术蓝本。
生物通微信公众号
知名企业招聘