PM2.5的成分、暴露与心血管疾病:一项整合疾病发病率和生物标志物的多队列研究

《Environment & Health》:PM2.5 Composition Exposure and Cardiovascular Disease: A Multicohort Study Integrating Disease Incidence and Biomarkers

【字体: 时间:2025年11月20日 来源:Environment & Health 6.3

编辑推荐:

  PM2.5长期暴露与心血管风险及亚临床生物标志物的关联性研究显示,有机物(OM)、硫酸盐(SO42?)和海盐(SS)与心肌梗死、中风及炎症标志物(如TNF-α、MCP-1)显著相关,单组分贡献率均超19%。研究基于美国All of Us队列(25.5万人)和中国COMPASS队列(648人),结合混合模型分析,强调需制定成分特异性空气污染监管策略。

  长期暴露于细颗粒物(PM?.?)的不同化学成分对心血管疾病(CVD)风险的影响存在显著差异,然而,目前整合临床和亚临床终点的研究证据仍然有限。本研究通过分析来自All of Us研究计划的255,394名参与者(2017-2022年)以及来自Chicago Multiethnic Prevention and Surveillance Study(COMPASS)的648名参与者(2015-2019年),探讨了PM?.?成分与心肌梗死(MI)、中风以及相关生物标志物(如肌钙蛋白、肿瘤坏死因子α(TNF-α)和单核细胞趋化蛋白-1(MCP-1))之间的关联。研究发现,有机质(OM)、硫酸盐(SO?2?)和海盐(SS)在所有研究终点中表现出一致的关联性。例如,每增加一个四分位数范围(IQR)的OM,心肌梗死的危险比(HR)为1.33(95%置信区间(CI)为1.07-1.67),中风的HR为1.40(95% CI为1.08-1.81);肌钙蛋白升高的比值比(OR)为1.40(95% CI为1.01-1.94),TNF-α升高的OR为1.40(95% CI为1.03-1.90);MCP-1的线性系数为0.40(95% CI为0.18-0.61)。在混合分析中,OM、SO?2?和SS各自贡献了至少19%的总体关联性。研究结果表明,特定的PM?.?成分,尤其是OM、SO?2?和SS,与心血管风险和亚临床功能障碍的增加有关,强调了基于成分的空气质量监管的重要性。

### 引言

空气污染,特别是细颗粒物(PM?.?)的暴露,已被公认为全球死亡和疾病的主要原因之一。已有研究证实了PM?.?暴露与心血管疾病(包括心肌梗死、中风和心力衰竭)之间的因果关系。据估计,PM?.?暴露每年导致近四百万人死亡,其中超过一半与心血管疾病相关。美国心脏协会也指出,空气污染导致了美国25%的心血管疾病死亡。PM?.?并非单一实体,而是一个由多种来源构成的复杂混合物。不同成分具有不同的化学和生物毒性,因此相同质量的PM?.?可能因成分不同而表现出不同的健康风险。这种异质性促使研究人员关注特定PM?.?成分对心血管疾病的影响。已有研究证实,某些PM?.?成分,如黑碳(BC)、有机质(OM)、铵(NH??)和硫酸盐(SO?2?),均与心血管疾病结局存在一致的关联。然而,这些研究主要集中在医院就诊或住院记录,以及短期暴露(如滞后0-3天)上,仅有少数研究关注长期暴露的影响。此外,医院就诊数据易受选择偏倚影响,因为不同地区和人群可能因医疗资源可及性、健康行为或诊断标准不同而出现差异。因此,前瞻性队列研究可以减少这些偏倚,但仍然存在因医疗利用差异带来的选择偏倚。因此,需要更多的前瞻性队列研究来理解长期暴露于PM?.?成分对心血管疾病的影响,并识别关键成分。

### 方法

本研究利用了两个互补的队列,以评估PM?.?成分对心血管疾病发病率和相关生物标志物的影响。首先,我们使用All of Us研究计划中超过25万名参与者的电子健康记录(EHR)数据,分析PM?.?成分暴露与心肌梗死和中风风险之间的关联。其次,我们分析了来自COMPASS队列的648名参与者血液样本中的心血管疾病相关生物标志物,包括肌钙蛋白、TNF-α和MCP-1。为了评估慢性暴露,我们关注的是1年的平均PM?.?成分暴露窗口,因为我们的前期研究显示这一时间段对检测暴露相关变化最为敏感。

#### 研究设计

All of Us研究计划由美国国家卫生研究院(NIH)于2017年启动,招募了来自美国各地的多样化成年人群(18岁及以上),这些人群可以通过医疗保健提供者组织或直接志愿者的方式加入。参与者在同意后提供了丰富的健康数据,包括结构化调查(涉及人口统计、生活方式、医疗和家族史)、身体测量、电子健康记录(EHR)、生物样本(血液和/或唾液)以及可穿戴设备数据。EHR数据被整理为Observational Medical Outcomes Partnership(OMOP)通用数据模型(CDM),并在经过标准化清理和优化后整合到受控数据存储库中。参与者调查数据通过REDCap代码本进行处理,并转换为OMOP兼容格式,以适应不同数据敏感性和访问要求的分层数据环境。生物样本在收集后24小时内被集中处理和分装,用于长期存储和分析。目前,All of Us研究计划已涵盖超过848,000名成年人。本研究使用All of Us数据的受控层级,涵盖2017年5月31日至2022年12月31日期间加入的参与者,数据于2025年2月3日发布,并与我们的暴露数据对齐。我们限制研究人群为那些具有有效EHR和居住地址数据的参与者,并将分析限制在35岁及以上的人群,因为年轻人群的心脏病或中风风险较低。

COMPASS是一个基于芝加哥的人群队列研究,旨在探讨生活方式、环境、医疗相关和遗传因素如何影响慢性疾病差异。参与者需满足以下条件:(1)在入组时年龄18岁或以上;(2)能够同意并提供英语或西班牙语的调查数据;(3)愿意提供血液、尿液和唾液样本以及电子健康记录的访问权限。截至研究开始,COMPASS已招募了超过8000名成年人,覆盖了芝加哥的77个社区。参与者通过社区和诊所的招募策略加入,包括入户访问、移动医疗单位的参与以及广泛的社区参与活动。入组时,参与者完成了一份1小时的详细调查,同意访问过去的和未来的医疗记录,并接受临床和身体测量,同时提交现场生物样本(包括血液、尿液和唾液)。部分参与者还提供了室内空气质量监测数据和粪便样本。所有生物样本在收集后24小时内被处理和分装,以确保长期储存和分析的准确性。更多关于研究设计的详细信息可在其他文献中找到。

#### EHR中的诊断信息

All of Us参与者向研究计划提供了完整的电子健康记录(EHR)。研究计划从参与的医疗系统中整理和统一EHR数据,包括入组前的回顾性记录和入组后的前瞻性数据。本研究使用了All of Us受控层级的数据,涵盖截至2022年12月31日的所有EHR数据。EHR中的诊断信息通过系统化医学名词—临床术语(SNOMED-CT)代码确定,并映射到OMOP概念ID。这一过程涉及从超过300个不同的医疗提供者组织提取、转换和加载数据,包括将源诊断代码(如ICD-9-CM、ICD-10-CM)映射到OMOP CDM中的SNOMED-CT概念。此外,应用了严格的数据质量框架,包括语法检查以确保数据符合OMOP CDM的结构要求,以及语义检查以确保临床合理性。完整的OMOP概念列表可在支持信息中找到。我们识别了入组后发生的MI和中风的首次诊断,并计算了这些事件的随访时间。对于没有相关事件的参与者,随访时间计算为从入组到2022年12月31日或死亡的时间差。我们还从EHR中检索了动脉粥样硬化性心血管疾病(ASCVD)历史、高血压状态和2型糖尿病状态。高血压被定义为在EHR中有两个或以上的高血压诊断或描述,并至少有一次高血压药物处方。

#### All of Us中的协变量

All of Us参与者在入组时填写了基本信息和生活方式问卷。基本信息问卷收集了年龄、种族/民族、教育水平、婚姻状况、家庭收入和地理信息。生活方式问卷收集了烟草、酒精和其他药物的使用情况。基于这些问卷,我们获取了年龄、性别、自我报告的种族/民族、家庭收入、教育水平、当前吸烟状况、当前饮酒情况等数据。体重指数(BMI)通过入组时的身高和体重计算得出,并分为体重不足(<18.5)、正常(18.5-25)、超重(25-30)和肥胖(>30)四个类别。剥夺指数是一个基于六个社区层面社会经济变量的综合评分,并被标准化为0到1的范围,更高的指数表示更严重的剥夺,这可以视为不同地区医疗资源可及性的代理指标。

#### COMPASS中的CVD生物标志物测量

COMPASS参与者血液中的肌钙蛋白I、TNF-α和MCP-1水平通过多路复用分析(multiplex assays)进行测量,使用Human Custom ProcartaPlex 12-Plex免疫分析(Life Technologies Corp, CA, USA)。具体而言,25微升的血浆和标准品被加入到96孔板的每个孔中,随后加入分析缓冲液和多路复用珠溶液,按照制造商的协议进行操作。在室温下孵育2小时后,加入检测抗体混合物和链霉亲和素-藻红蛋白溶液。孵育和洗涤后,使用Luminex 200仪器(Luminex Corporation, Austin, Texas)分析板。通过中位荧光强度(MFI)确定分析物浓度,并与标准曲线进行比较。四参数逻辑(4PL)曲线用于生成标准曲线。所有测量结果均以皮克每毫升(pg/mL)为单位。

#### COMPASS中的协变量

我们在COMPASS中收集了与All of Us相同的协变量。年龄、种族、性别、教育水平、家庭收入和ASCVD历史通过问卷收集。BMI、高血压和2型糖尿病通过参与者在研究诊所的访问确定。剥夺指数通过国家层面的区域剥夺指数(ADI)测量得出。

#### PM?.?成分暴露

本研究分析了七种PM?.?成分,包括NH??、BC、矿物尘(DUST)、硝酸盐(NO??)、OM、SO?2?和海盐(SS)。我们从华盛顿大学圣路易斯分校的大气成分分析小组获得了PM?.?成分暴露数据,该小组提供了北美的0.01° × 0.01°(约1.1平方公里)分辨率的估计值。PM?.?成分的年、月和双周质量浓度通过结合气溶胶光学深度(AOD)检索(Dark Target、Deep Blue和MAIAC)以及使用GEOS-Chem化学传输模型进行估算,并通过地理加权回归(GWR)与区域地面观测数据进行校准。为了避免重复计算,成分浓度通过化学平衡程序进行重建,例如NH??被估计为与硫酸盐和硝酸盐相关的中和部分,而硝酸盐被报告为颗粒硝酸盐质量。因此,各成分的总和可能不等于总PM?.?质量,反映了化学一致性的优先考虑以及实现完全质量闭合的已知不确定性。最高的缓冲离开聚类(BLeCO)交叉验证的成分一致性与SO?2?(R2 = 0.88)、NH??(R2 = 0.78)和NO??(R2 = 0.85)相关,其他成分也表现出显著的性能(R2 = 0.43–0.67)。均方根差异(RMSE)分别为NH??、NO??、BC和SS为0.1,DUST为0.2,SO?2?为0.3,OM为0.7。

All of Us数据包含3位数的邮政编码,以保护隐私。因此,我们将PM?.?成分暴露水平平均到每个3位数的邮政编码网格。每位参与者被分配到其居住的3位数邮政编码水平的平均PM?.?成分浓度。为了捕捉慢性暴露,我们计算了从随访结束或事件发生前12个月的平均浓度。对于COMPASS,我们根据居住的地理编码回顾性地分配了12个月的PM?.?成分暴露。这种方法捕捉了累积暴露的影响,提供了对长期暴露的全面评估,并在之前的研究中常用。

### 统计分析

在All of Us中,我们使用分层Cox比例风险模型,通过单个PM?.?成分估计HR和对应的95% CI。PM?.?成分变量通过将原始浓度除以其各自的四分位数范围(IQR)进行缩放,因此结果应解释为每增加一个IQR的关联。分层项包括入组时的年龄、种族、性别、家庭收入和情境剥夺。模型还调整了潜在的混杂因素,包括BMI、吸烟状况、饮酒情况、高血压状态、ASCVD历史、2型糖尿病以及平均温度的罚样条(penalized splines)。总体而言,模型可以表示为:

$$ h(t|X) = h_0(t|age, sex, race, household income, contextual deprivation) \times exp(\beta_1(BMI) + \beta_2(alcohol drinking) + \beta_3(hypertension) + \beta_4(ASCVD) + \beta_5(smoking status) + \beta_6(type 2 diabetes) + \gamma_1(PM_{2.5} component) + \gamma_2(s_1(temperature))) $$

其中,$ s(*) $ 表示罚样条。为了调整地理单位(如3位数邮政编码)内的残余自相关并减轻生态偏倚,我们使用广义估计方程(GEE)计算了效应估计的统计稳健CI。具体而言,我们已经将3位数邮政编码作为随机截距,并计算了集群稳健的标准误差。

在COMPASS中,我们使用混合效应模型估计PM?.?成分暴露与CVD生物标志物之间的关联。对于MCP-1变量,使用线性回归估计对数转换水平的平均变化(β)和对应的95% CI。对于肌钙蛋白和TNF-α变量,使用逻辑回归估计升高组的比值比(OR)和对应的95% CI。PM?.?成分变量同样通过将原始浓度除以其各自的IQR进行缩放。为了进一步消除潜在的空间变异混杂因素,我们在模型中包含了住宅邮政编码的随机效应截距,并计算了集群稳健的标准误差。模型调整了All of Us分析中提到的所有协变量。

一些协变量存在缺失值,最常见的包括教育水平、家庭收入、BMI和吸烟状况。为了最小化偏差和统计功效的损失,我们假设这些值是随机缺失的,并使用随机森林算法通过R中的MICE包进行多重插补。生成了10个插补数据集,并使用Rubin的规则进行结果合并。插补模型包括了分析中使用的所有变量,包括暴露和结局变量,以增强随机缺失假设的合理性。

此外,在All of Us中,我们进行了敏感性分析,使用Fine–Gray次分布风险模型,该模型在存在竞争事件的情况下估计累积发病率函数。这些分析结果表明,PM?.?成分与MI和中风的关联与Cox模型的主要结果一致,表明竞争事件没有显著偏倚我们的主要结果。

### 结果

#### 研究人群

从All of Us的总体849,000名参与者中,有393,596名具有有效的EHR数据。其中,304,050名参与者在35岁或以上,具有3位数邮政编码的居住地址记录。在排除了2022年之后入组的参与者后,共有255,394名参与者从All of Us研究计划中纳入,用于CVD发病率分析。研究人群覆盖了美国连续领土的几乎所有地区(空间分布可在支持信息图S2中找到)。每个3位数邮政编码区域的参与者数量中位数(四分位数范围)为106(72-140)。大多数All of Us参与者为女性(59.1%)和非西班牙裔白人(58.1%),平均年龄(标准差)为58.8(12.6)岁。在随访期间,我们从EHR中识别了1307例首次心肌梗死病例和1810例首次中风病例,对应的发病率分别为每100人年0.18和0.24。

#### PM?.?成分暴露

在All of Us和COMPASS的参与者中,PM?.?成分的暴露水平在两个队列中均较高,但存在显著的地区和成分差异。OM在两个队列中均显示出最高的平均浓度,分别为2.85 μg/m3和2.03 μg/m3,其次是SO?2?,其浓度分别为1.16 μg/m3和0.31 μg/m3。SS在两个群体中浓度最低,平均分别为0.15 μg/m3和0.03 μg/m3。值得注意的是,NO??在All of Us中排名第三(0.87 μg/m3),但在COMPASS中为第二低(0.05 μg/m3)。在两个队列中均观察到OM与BC之间的强相关性,相关系数分别为0.74和0.81。过去二十年,所有七种PM?.?成分的浓度,除了OM外,均呈现出下降趋势。然而,近年来我们观察到OM浓度的显著上升,尤其是在美国西部地区。因此,我们的研究队列中,OM浓度已经处于PM?.?成分中的最高水平,而火灾季节的OM浓度进一步增加,导致人口暴露于这一有毒成分的增加。OM来源于燃烧过程和二次有机气溶胶,已知其会促进系统性炎症和氧化应激。例如,OM通常包含多环芳烃(PAHs),这些物质会促进活性氧的生成。SO?2?作为长距离传输污染和工业排放的标志物,已知会促进内皮功能障碍和血管炎症。SS虽然通常被视为自然气溶胶,但在受到人为来源影响时,可能携带有毒金属和有机化合物,特别是在沿海城市地区。这些成分与生物标志物的关联提供了生物学上的合理性,并支持了成分特异性暴露与CVD发展的潜在联系。

#### 单个PM?.?成分的关联

在All of Us参与者中,所有七种PM?.?成分均与心肌梗死(MI)风险呈正相关。其中,OM、SO?2?和SS表现出显著的关联。例如,每增加一个IQR的OM,心肌梗死的HR为1.33(95% CI为1.07-1.67),中风的HR为1.40(95% CI为1.08-1.81);肌钙蛋白升高的OR为1.40(95% CI为1.01-1.94),TNF-α升高的OR为1.40(95% CI为1.03-1.90);MCP-1的线性系数为0.40(95% CI为0.18-0.61)。在混合分析中,OM、SO?2?和SS各自贡献了至少19%的总体关联性。这些结果强调了在评估心血管疾病时,考虑成分特异性风险的重要性。

#### 混合暴露的关联

我们使用基于四分位数的g计算方法来估计PM?.?成分的联合影响,并估算每个成分的贡献,同时考虑多重共线性。基于四分位数的g计算分析显示,OM、SO?2?和SS在所有结局中均为主要贡献者,各自贡献了超过19%的混合关联。这些发现强调了评估污染物混合物的重要性,而不仅仅是单独的成分,并突显了针对特定排放源进行有针对性的监管行动的潜力。此外,本研究在两个不同的研究人群中的结果一致性也值得注意,这为我们的发现提供了额外的强度。

### 讨论

本研究结合了两个独立的队列,以评估长期暴露于PM?.?化学成分与心血管疾病结局之间的关联。通过分析All of Us队列中超过25万名参与者和COMPASS队列中648名参与者,我们的研究结果一致地识别了OM、SO?2?和SS作为与心肌梗死、中风和不良生物标志物谱相关的主要成分。这些发现强调了在空气污染流行病学和监管政策中,需要超越总PM?.?质量,考虑成分特异性风险的重要性。通过整合生物标志物数据与大规模流行病学队列,可以更好地理解空气污染对心血管健康的影响,并为减少空气污染带来的心血管负担提供针对性的干预措施。

尽管本研究的发现具有重要意义,但也存在一些局限性。首先,All of Us队列的住宅数据被汇总到3位数邮政编码级别,这未能完全捕捉个体层面的暴露变化,因为人们可能在移动或室内空气质量存在差异,这可能导致暴露误分类和生态偏倚。我们通过纳入住宅3位数邮政编码的随机效应和集群稳健的不确定性估计,以及调整剥夺指数作为医疗资源可及性的区域层面代理指标,试图减轻这些影响。然而,这些步骤并不能完全消除区域差异带来的残留空间混杂和生态偏倚。此外,使用较粗的地理分辨率通常会导致对真实关联的低估。尽管如此,研究中使用的3位数邮政编码级别的暴露数据仍然提供了关于单个PM?.?成分健康影响的关键证据。

其次,PM?.?成分模型的预测准确性在某些成分上是中等的,这可能导致暴露误分类。然而,这些误差在研究队列中可能是非差异性的,即对CVD的影响可能不会产生偏倚。非差异性暴露误分类通常会将效应估计偏向于无效应,并减少统计功效。因此,我们观察到的OM、SO?2?和SS的显著关联可能是保守的。

第三,我们的分析仅限于具有可用EHR数据的All of Us参与者,这些人可能在医疗可及性、健康状况和暴露水平上与没有EHR数据的人群存在系统性差异。这种选择过程可能会影响我们的效应估计,且由此产生的残留混杂无法完全排除。

第四,尽管我们调整了多个混杂因素,但残留混杂来自未测量的变量(如体力活动或饮食)仍然存在。

第五,COMPASS队列是本地化的,主要由非西班牙裔黑人组成,来自低收入家庭,这可能限制其普遍性,但也提供了对一个被忽视和代表性不足人群的重要见解。

第六,缺失的协变量数据可能引入不确定性,特别是如果缺失数据不符合我们插补方法所假设的随机缺失条件。通过使用一种可以处理非线性关系和交互作用的随机森林插补方法,我们试图减少潜在的插补偏差。然而,残留偏差由于未测量或系统性缺失的数据仍然无法排除。

### 结论

本研究的结果表明,长期暴露于特定的PM?.?成分,尤其是有机质(OM)、硫酸盐(SO?2?)和海盐(SS),与心血管事件和不良生物标志物谱的增加有关。这些关联在不同的研究人群和临床与生物标志物结局中均被观察到,强调了在空气污染流行病学研究和监管政策中,需要超越总PM?.?质量,考虑成分特异性风险的重要性。整合生物标志物数据与大规模流行病学队列可以更好地理解空气污染对心血管健康的影响,并为减少空气污染带来的心血管负担提供针对性的干预措施。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号