综述:个人空气污染暴露评估:监测方法及大数据与机器学习的新兴作用

《Environmental Technology & Innovation》:Personal Air Pollution Exposure: Monitoring Methods and the Emerging Role of Big Data and Machine Learning

【字体: 时间:2025年10月29日 来源:Environmental Technology & Innovation 7.1

编辑推荐:

  本综述系统评估了个人空气污染暴露评估方法,重点聚焦时间活动模式、个人暴露监测(PEM)和基于GPS的建模。文章指出,尽管PEM能提供高分辨率数据,但存在校准复杂和环境敏感性等局限。为克服这些挑战,整合多源数据、物联网(IoT)和机器学习(ML)等新兴技术正推动暴露评估向更动态、个性化和精准的方向发展,为公共卫生干预提供有力支持。

  

引言

空气污染因其对人类健康的重大影响而日益成为全球关注的焦点。研究表明,环境空气污染在死亡率和心血管疾病恶化中扮演重要角色。此外,暴露于高水平空气污染会显著增加慢性阻塞性肺病、肺癌等疾病的患病风险。暴露评估是通过剂量-反应关系评估空气污染健康风险的基础。在暴露科学的早期阶段,空气污染物的暴露评估通常依赖于固定的环境空气监测站,这些站点提供的时空分辨率有限,且往往忽略了人群在不同环境间的流动性。鉴于个体约80%-90%的时间在室内度过,固定的环境监测对于评估空气污染物暴露是不充分的。
为了应对这些局限性,个人暴露评估已成为精确量化个体空气污染物暴露的关键工具。与传统环境监测相比,个人暴露方法追踪个体在其特定环境中的实际暴露,能更精确地表征健康风险。这些方法包括时间活动模式、个人暴露监测和基于GPS的方法,它们相较于传统方法提供了更好的时空精细化覆盖。

空气污染暴露评估研究现状

文献计量分析显示,自2011年以来,空气污染暴露评估研究数量显著上升,尤其在2016–2020年间出现显著增长。从方法学角度看,个人暴露监测(PEM)占比最大(26.1%),其次是基于模型的评估(24.8%)、时间活动模式分析(18.2%)、基于GPS的方法(17.8%)和实时监测技术(13.2%)。从地区分布看,美国和中国是发表文献最多的国家,欧洲国家也是主要贡献者,而非洲和南美洲的研究相对较少,这反映了经济发展和研究资源分配的差异。

空气污染物暴露评估方法

时间活动模式:精确暴露评估的基础

个人暴露可以通过个体监测直接评估,也可以通过结合时间活动数据估算关键微环境中的污染物浓度来间接评估。个体实际上是在多个微环境(如家庭、交通环境、工作场所和户外区域)中暴露于空气污染的。因此,将微环境污染数据与动态行为信息相结合,对于提高暴露评估的准确性和健康风险分析的可靠性至关重要。
时间活动模式详细描述了个体在不同环境中进行活动的持续时间和类型。当无法进行直接测量时,将时间活动数据纳入暴露评估可显著提高准确性。时间活动模型将每日暴露估计为时间加权浓度,通过将每个微环境中的污染水平乘以在该处停留的时间并求和得到。
准确的个人暴露估计需要两个组成部分:基于个体时间活动模式的Tm,以及基于测量或模型的相应微环境中污染物浓度的Cm。将这两个维度联系起来,为所有后续的暴露评估方法奠定了基础。个人暴露评估需要记录个体所经环境的污染物浓度,并将其与时间活动数据相关联。
时间活动数据可以通过问卷或GPS追踪来收集。问卷包括实时记录和回顾性调查。实时记录能提供准确的位置、活动和环境条件数据,但负担较重,适用于小规模研究。回顾性调查适用于大规模人群,但依赖于参与者的回忆,可能存在分辨率低、回忆偏差和隐私问题。GPS追踪则提供了一种高分辨率的替代方案,能提供客观的时间活动数据。将GPS追踪与问卷相结合,可以使研究人员在获取详细移动轨迹的同时,收集活动和行为信息,从而显著提高暴露评估的准确性和可靠性。

个人暴露监测方法

空气污染暴露评估的基础在于对各种空气污染物的准确监测。泵采样是测量个人空气污染暴露的最早方法之一。该方法通过在人体的呼吸区附近,将固定体积的空气抽过滤膜,并根据滤膜采样前后的重量差来确定污染物浓度。这种方法能够对污染物进行详细的化学分析,但对于评估急性健康影响至关重要的短期污染事件或峰值则无法检测。
随着传感器技术的进步,实时监测器在空气质量监测中越来越受欢迎,通过获取具有高时空分辨率的实时数据,显著提高了空气污染评估的精度。实时监测器能够检测气态空气污染物和颗粒态空气污染物。近年来,实时传感器技术的进步促进了便携式、经济实惠且日益精确的传感器的发展,显著拓宽了空气质量监测的范围。这些低成本传感器现已广泛应用于实时PM2.5监测计划中。
然而,低成本传感器面临着环境敏感性、传感器漂移和交叉敏感性等持续挑战,这些问题会削弱数据的准确性。特别是在温度和湿度波动的条件下,这些问题更为突出。因此,传感器校准对于提高实时空气污染监测器的准确性和一致性至关重要。常见的校准方法包括针对响应可预测的传感器的线性模型,用于动态校准的多元线性回归,以及针对复杂非线性行为的随机森林模型和人工神经网络等先进技术。尽管有这些改进,大多数模型仍然依赖于高质量的基线数据,并且需要定期重新校准以保持准确性。
便携式空气污染监测仪被认为是评估个体暴露的“金标准”。传统的固定采样仪器通常昂贵且操作复杂,而用于测量空气污染物浓度的便携式设备的发展提供了具有高时间分辨率和实时响应能力的数据。这些设备可以连续监测受试者3米范围内的污染物,从而可以更准确地评估实际的个人暴露水平。小巧的高分辨率监测仪可以与GPS配对,实现对日常生活中的时空细节追踪。
然而,实际部署面临若干挑战:有限的电池寿命、不稳定的蓝牙连接、参与者依从性以及传感器校准的变异性。此外,由于易受外部环境因素影响,便携式监测仪在不同微环境下的准确性和稳定性不足。未来的研究应进一步评估便携式监测仪的性能,并建立适当的验证方案和操作程序,以确保数据收集的准确性。

基于GPS的暴露估计与建模

虽然个人暴露监测能提供直接且高度准确的污染物浓度测量,但它资源密集,且难以大规模实施。此外,它不能完全捕捉影响个体全天暴露的动态流动模式。为了解决这些局限性,暴露建模技术被开发出来,作为更好地描述个人暴露时空变异性的替代方法。
在过去的二十年中,已经开发了几种空气污染暴露建模方法,旨在估计个体水平的暴露风险。这些模型主要旨在描述空气质量浓度,作为个体暴露的替代指标,其假设是特定人口区域内的受试者受到类似的空气污染暴露。然而,这种方法缺乏高分辨率暴露建模所需的个体实际“时间活动”信息,这可能导致个人暴露评估出现显著偏差。
GPS技术通过测量从卫星传输到地球GPS接收器的无线电信号的时间延迟来运作。配备GPS设备和加速度计,可以实时连续追踪参与者的位置、速度和移动。这些数据与GIS和统计模型相结合,可以详细分析不同环境下的时间活动模式和相应的暴露水平。与基于空气监测站的传统区域大规模人群暴露评估相比,该方法实现了从静态监测向时空技术的转变,能够准确评估个体的暴露水平。
此外,许多研究使用低成本的便携式空气传感器沿个体移动路径进行空气污染测量,并将GPS数据与空气污染地图相结合,以准确评估个体暴露。GPS技术具有连续可记录、高时空分辨率和对调查对象负担低的优点。然而,从原始GPS数据中提取准确的人类受试者时间活动模式存在障碍,因为它们由于卫星或接收器问题、大气和电离层扰动、多路径信号反射或信号丢失或阻塞而引起的误差并不总是可靠。为了缓解这些问题,整合和清理来自多个来源的数据,并将基于规则的模型与随机森林算法相结合,可以有效提高时间活动模式的分类准确性,并增强基于GPS的暴露评估的可靠性。
随着对精确个人空气污染暴露评估需求的增长,针对不同场景选择合适的暴露评估方法是一个值得注意的考量。这有助于在多方面理解不同环境下个体的暴露水平。

空气污染暴露评估的进一步发展

目前,评估人类空气污染暴露方法的研究已取得一些进展。然而,现有技术在空间分辨率、实时适应性以及个体行为整合方面仍存在局限性。因此,个体空气污染暴露评估方法有望向更精准、多源数据整合和动态时空分辨率的方向发展。

多源数据与物联网技术的整合

未来的暴露评估将越来越依赖于多源数据融合。例如,将GPS与Wi-Fi和蓝牙等其他传感器数据集成,可以提高轨迹准确性,并改善与污染场的链接。这种集成是向物联网技术更广泛转变的一部分。低成本空气质量传感器的日益普及和物联网的发展将进一步促进个体水平不同微环境中的实时监测和动态暴露评估。整合来自多个来源的实时数据,可以提供连续的、动态的个人暴露评估,使得能够根据个体活动实时跟踪和调整暴露水平。数据融合已成为推进动态、个性化暴露评估的关键技术路径,通过提高时空分辨率、实时响应能力以及个体暴露估计的准确性。

机器学习的应用

为了充分利用集成的实时数据,机器学习和人工智能技术有望在改进数据校准和暴露模型方面发挥关键作用,通过处理复杂的数据模式和非线性关系。这些方法不仅提高了低成本传感器的校准精度和暴露预测的准确性,还支持时空插值和高分辨率暴露预测。几项研究已经证明了使用机器学习算法在个体和群体尺度上模拟空气污染暴露。然而,选择合适的算法取决于几个因素,包括模型的预测准确性、计算效率和数据需求。
虽然机器学习的进步提高了暴露评估的时空分辨率,但严格的模型验证仍然至关重要。最近的研究采用留一法交叉验证、空间交叉验证以及与移动或个人监测仪的对比来评估高分辨率暴露模型的准确性。然而,挑战依然存在,包括空间异质性、有限的地面真实数据。重要的是,增加数据集大小并不总能提高模型性能,并可能引入新的问题,例如计算需求增加、数据冗余以及处理时间非平稳性的困难。因此,未来的研究不仅应关注获取更多数据,还应侧重于提高模型的泛化能力,结合可解释的人工智能方法,以及优化数据集成框架,以实现有效且可扩展的暴露建模。
此外,复杂机器学习模型的可解释性,特别是深度学习,仍然有限。为了提高可解释性,可解释的SHAP值、部分依赖图(PDP)和空间适应的变量重要性度量正被越来越多地用于阐明模型行为并增强利益相关者的信任。
尽管暴露评估方法取得了实质性进展,但它们与健康结果模型的整合仍然是暴露评估的关键下一步。机器学习技术现在越来越多地应用于建立空气污染暴露与健康结果之间的定量联系。通过整合污染浓度数据与健康结果指标,机器学习模型有助于构建暴露-反应关系,并实现跨个体的风险评估。这些应用反映了机器学习支持全面的、健康导向的暴露评估的日益增长潜力。

个性化和动态暴露评估

除了整合实时数据和优化技术建模外,将行为科学纳入暴露评估对于理解个体如何改变其行为以减少有害污染物的暴露至关重要。这包括对暴露水平的实时反馈,鼓励个体避开某些区域或调整其日常活动,以尽量减少与高污染环境的接触。结合个性化暴露建模,行为改变可以显著增强公共卫生干预的有效性。
近年来,结合行为数据和个体活动轨迹的个性化空气污染暴露评估模型已演变为一个集成了“实时监测-反馈干预-行为调整”的闭环系统。未来,在智能手机和可穿戴设备日益普及的背景下,个性化传感器反馈在提高公众环境意识和促进行为改变方面的作用,特别是在环境健康管理中的价值,正变得越来越明显。
未来空气污染暴露评估的研究可能会侧重于上述几种创新方法,以提高暴露模型的准确性和实际应用。它们的共同关键目标是整合个性化暴露评估,这不仅考虑环境因素,还考虑个体活动模式。这将更准确地反映暴露水平,并在更精细的尺度上支持健康风险预测。特别是,个性化暴露评估的发展为理解不同人口亚群之间的暴露不平等提供了新的机会。通过纳入社会经济和行为变量,最近的研究揭示了暴露模式的显著差异。可穿戴传感器、实时位置数据和机器学习算法的整合,使研究人员能够以改进的时空分辨率检测这些不平等现象。这一进步不仅加深了我们对环境不公正的理解,也支持设计公平的、数据驱动的公共卫生干预措施。

结论

空气污染暴露评估在评估健康风险和指导有效的公共卫生干预方面起着关键作用,因此需要先进的评估方法。尽管个人暴露监测(PEM)等技术能提供高分辨率数据,但存在校准复杂和环境敏感性等局限。为克服这些挑战,整合多源数据、物联网(IoT)和机器学习(ML)等新兴技术正推动暴露评估向更动态、个性化和精准的方向发展。未来的进步预计将聚焦于开发成本效益高、耐用、能监测多种污染物且具有改进的抗漂移能力和用户交互能力的传感器。此外,应开发基于机器学习的先进校准方法,以提高在真实环境条件下的测量准确性。整合多源数据将增强暴露估计的时空精度。通过配备内置行为反馈系统的移动和可穿戴平台扩展实时、个性化暴露建模,可以使个体能够降低暴露风险,并为弱势群体提供有针对性的干预支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号