《Advanced Science》:Tobacco Smoke Exposure From Prenatal To Adolescent Periods Drives IBD Pathogenesis: Dynamic DNA Methylation Signatures Across Lifespan Stages
1 引言
炎症性肠病(IBD)是一种慢性免疫介导的胃肠道疾病,主要包括克罗恩病(CD)和溃疡性结肠炎(UC)。自20世纪出现以来,IBD的发病率和患病率持续上升,尤其在工业化国家,给全球医疗系统带来了沉重负担。由于目前缺乏根治性治疗方法,加深对危险因素和致病途径的理解对于推进IBD的靶向预防和治疗策略至关重要。
IBD的病因受遗传和环境因素共同影响,烟草吸烟是研究最深入的环境风险因素之一。大量研究已证实成年期吸烟状态与老年人IBD发病率之间的关联,且表观遗传因素介导了此关联。此外,生命早期吸烟暴露,包括母体孕期吸烟(MSDP)、产前吸烟暴露以及儿童期主动和被动吸烟暴露,也被报道与IBD风险增加相关。然而,这些研究间的异质性和有限的统计效力导致了关于生命早期吸烟暴露与IBD风险潜在关联的不一致和不确定性。另一方面,支持成年期前主动吸烟与IBD风险关联的证据相对有限。最后,生命早期吸烟暴露影响IBD发展的机制尚不清楚。表观遗传修饰,特别是DNA甲基化,可能是理解环境因素如何影响疾病发病机制的关键。
2 结果
2.1 成年期前的主动吸烟和MSDP与较高的IBD风险相关
在英国生物银行队列研究中,中位随访13.9年,共识别出3736例IBD、1086例CD和2420例UC发病事件。与未暴露于MSDP相比,暴露于MSDP的个体发生IBD(HR = 1.13)、CD(HR = 1.21)和UC(HR = 1.11)的风险增加。此外,在青春期开始吸烟的个体发生CD(HR = 1.79)和IBD(HR = 1.35)的风险更高。虽然统计学上不显著,但数据提示成年期前主动吸烟对60岁以上个体UC发展可能存在潜在保护性关联。未观察到儿童期主动吸烟与IBD及其亚型风险之间存在显著关联。年龄分层分析表明,MSDP以及青春期主动吸烟对CD和IBD风险的影响主要出现在60岁以下人群中。
2.2 荟萃分析进一步验证生命早期被动吸烟暴露与CD和UC风险潜在相关
初步荟萃分析纳入了7项队列研究,总样本量分别为IBD 853,080例、CD 1,120,892例、UC 1,121,857例。所有纳入的队列研究均为高质量(评分超过7分)。荟萃分析估计IBD、CD和UC的合并相对风险(RR)分别为1.27、1.13和1.11。在IBD总体分析中发现中度异质性(I2 = 66%),可能由一项研究(Omer Karur_2021)引起。对于UC结局,Egger检验提示可能存在发表偏倚。
在二次荟萃分析中,纳入了7项队列研究和16项病例对照研究。纳入研究的质量评分范围为5至8分,代表中到高质量。当排除异质性来源后,MSDP与IBD、CD和UC风险之间的关联与初步分析结果一致。此外,儿童期被动吸烟暴露与CD风险增加潜在相关(RR = 1.40),而非UC(RR = 0.98),尤其是当CD发生在成年期时(RR = 1.77)。此外,产前烟草吸烟暴露与CD(RR = 1.55)和UC(RR = 1.47)风险均呈正相关,且无异质性或发表偏倚。
2.3 生命早期吸烟暴露引起的DNA甲基化改变可能影响IBD风险
在新生儿中6073个MSDP相关CpG位点中,分别有4217个和4216个具有可用于CD和UC表观遗传孟德尔随机化(MR)分析的局部甲基化数量性状位点(cis-mQTLs)作为工具变量。我们识别出122个新生儿中MSDP相关的CpG位点与CD风险相关,例如cg16490823(RPS6KA2,OR = 1.23)、cg02879453(ADCY7,OR = 3.53)、cg14588779和cg08097581(AKAP8L,OR = 1.09)、cg03644587(TNXB,OR = 2.16)、cg27068095(PRRT1,OR = 1.91)以及cg07404514(CLIC1/DDAH2,OR = 1.70)。关于UC的分析,发现了115个新生儿中MSDP相关的CpG位点与UC风险相关,包括AHRR内的五个CpG位点(OR = 1.43)、PRRT1内的八个CpG位点(OR = 3.61)、cg19089201(MYO1G,OR = 1.16)、cg23384708(TNF,OR = 2.68)、cg16391678(ITGAL,OR = 2.15)以及cg02135488(RPS6KA2,OR = 1.34)。
对于儿童期(5.5岁)MSDP诱导的DNA甲基化改变分析,所有五个CpG位点均有可用于CD和UC表观遗传MR分析的cis-mQTLs。然而,我们发现儿童期中三个MSDP相关的CpG位点与UC风险相关,即cg19089201(OR = 1.16)、cg22132788(OR = 1.13)和cg12803068(OR = 1.11)。它们均位于MYO1G区域。
关于青少年和成年期(16-48岁)MSDP诱导的DNA甲基化改变分析,69个CpG位点中有60个具有可用的工具变量用于后续分析。经过多重检验校正后,四个CpG位点的甲基化改变与CD风险相关,包括cg00174179(RHOA,OR = 0.26)、cg14179389(GFI1,OR = 0.84)以及位于FOXK1区域的两个CpG位点(cg14485097 [OR = 1.47] 和 cg25879142 [OR = 1.34])。此外,七个青少年和成年期MSDP相关的CpG位点与UC风险相关,即cg14179389(GFI1,OR = 0.85)、cg17924476(AHRR,OR = 1.18)以及位于MYO1G区域的四个CpG位点。
父系和祖母吸烟引起的新生儿DNA甲基化改变与IBD风险的分析未显示显著性。因此,这两种暴露被排除在后续分析之外。
2.4 外部IBD EWAS和既往研究进一步证实MSDP相关DNA甲基化对子代IBD发展的影响
与对照组相比,分别识别出7809个和1937个与CD和UC患者相关的差异甲基化CpG位点。接下来,我们将当前研究的结果与IBD EWAS及我们之前针对成人的研究进行了比较。
对于新生儿MSDP相关DNA甲基化的分析,共有49个基因座在IBD EWAS或我们之前的研究中得到了CD验证。具体而言,当前研究中的44个基因座在IBD EWAS中得到了验证。此外,有8个基因座在我们之前的研究中得到了验证。其中,有三个(EFEMP2、GFI1和TNF)是三项研究共有的。关于UC发现的重复,有24个基因座得到验证。特别是,11个在IBD EWAS中得到验证,19个在我们之前的研究中重复。其中,有6个基因座是三项研究共有的,包括AHRR、MYO1G、GFI1、LSP1和PRRT1。
关于儿童期(5.5岁)MSDP相关DNA甲基化的分析,只有MYO1G(其DNA甲基化状态改变与UC风险相关)在IBD EWAS和我们之前的研究中得到了重复。
关于青少年和成年期(16-48岁)MSDP相关DNA甲基化的分析,在CD分析中识别的三个基因座(即RHOA、GFI1、FOXK1)和在UC分析中发现的三个基因座(即GFI1、MYO1G、AHRR)在此阶段得到了重复。
2.5 多重验证分析验证了最可靠的DNA甲基化位点及IBD发病机制中不同生命阶段潜在的共享甲基化基因座
我们对在外部IBD EWAS和我们之前的研究中均得到重复的CpG位点进行了共定位分析,以加强不同子代生命阶段MSDP相关DNA甲基化与CD和UC风险潜在关联的证据。对于新生儿MSDP相关的CpG位点,有五个基因座(位于ADCY7、IFNG、TIGD7、AKAP8L和NCF4内)与CD的遗传易感性存在共定位证据(PPH4 > 0.80)。此外,四个基因座(位于AHRR、PRRT1、GNA12、ITGAL内)与UC易感性存在共定位证据。对于那些儿童期(5.5岁)和青少年及成年期(16-48岁)的MSDP相关CpG位点,只有一个基因座(位于RHOA,16-48岁)与CD的遗传易感性存在共定位证据。
接下来,我们评估了这些(在外部IBD EWAS和我们之前的研究中验证的)CpG位点在其相应基因上在肠道组织中的调控模式。对于新生儿MSDP相关的CpG位点,共有11个CpG位点被确定与CD分析中其映射基因(十个基因)的表达相关,13个CpG位点与UC分析中其映射基因(八个基因)的表达相关。关于青少年和成年期(16-48岁)MSDP相关的CpG位点,发现三个CpG位点与其映射基因(即GFI1、MYO1G和AHRR)在肠道组织中的表达相关。在这三个基因中,GFI1是CD和UC共有的基因座。
最后,我们比较了不同生命阶段识别的显著基因座,旨在识别在IBD发展过程中可能被不同生命阶段吸烟暴露所共享的DNA甲基化位点。我们发现,吸烟暴露在不同生命阶段诱导的LTA/TNF、AHRR、MYO1G和GFI1基因区域内DNA甲基化状态的改变,可能是IBD发展过程中一个跨生命周期的共享特征。
3 讨论
生命早期是生长和发育的关键敏感期,对许多疾病(包括IBD易感性)在晚年的发生和发展起着至关重要的作用。由于生命早期吸烟暴露被认为是影响IBD风险的关键因素,我们通过前瞻性队列研究和更新的荟萃分析评估了这种关联。我们发现MSDP与后代IBD、CD和UC风险增加潜在相关,且这种影响尤其在成年期显现。此外,青春期主动吸烟与晚年发生IBD和CD的风险增加相关。通过整合多组学数据,我们进一步识别出MSDP在多个基因座引起的DNA甲基化改变,这些改变可能在不同生命阶段参与CD和UC的发展。具体而言,PRRT1、ITGAL、AHRR和GNA12的甲基化改变可能与UC风险相关;PRS6KA2、SLC9A3、GFI1、MYO1G和TNF的甲基化改变也可能在UC发病机制中发挥作用。对于CD,识别出多个潜在参与的基因座,包括TIGD7、IFNG、AKAP8L、ADCY7、NCF4、PRS6KA2、TNF、GFI1、TNXB等。此外,我们发现AHRR、MYO1G、LTA/TNF和GFI1基因区域的DNA甲基化状态改变,可能是不同生命阶段吸烟暴露促进IBD发展的共享发病机制。
4 优势与局限性
本研究最突出的优势在于整合了观察性研究、荟萃分析、表观遗传MR分析以及一系列多组学证据,以界定DNA甲基化在生命早期吸烟暴露与IBD风险关联中的潜在作用,从而增强了研究结果的可靠性。其次,我们探讨了是否存在跨不同生命阶段吸烟相关的DNA甲基化位点,这些位点在IBD发病机制中具有共性。第三,除了统计和分析方面,在解释这些数据时还需考虑生物学因素。
本研究也存在一些局限性。首先,由于MSDP数据来自英国生物银行参与者填写的自我报告问卷,不能排除回忆偏倚的可能性。第二,鉴于英国生物银行参与者的年龄,我们无法评估生命早期吸烟对成年期前IBD风险的影响。第三,主要荟萃分析中评估各类生命早期吸烟暴露对IBD风险的影响受到现有队列研究数量有限的制约。第四,本研究的一个明显局限性是缺乏scRNA-seq样本的匹配基因型数据。第五,本研究的另一个局限性是跨组织推断。最后,除了统计和分析方面,在解释这些数据时还需考虑生物学因素。
5 结论
总之,我们的研究表明MSDP可能是后代IBD的一个危险因素,并且可能通过改变某些基因座的DNA甲基化状态来发挥作用。此外,青春期主动吸烟可能会增加晚年发生CD和IBD的风险。我们的研究还指出了跨不同生命阶段共享的DNA甲基化途径,吸烟暴露通过这些途径对IBD风险产生稳定影响。这些发现对于疾病发展的预测、靶向预防和新的治疗策略靶点具有重要意义。
6 方法
6.1 研究设计
本研究首先基于英国生物银行进行了一项队列研究,评估MSDP以及儿童期和青春期主动吸烟对IBD风险的影响。接下来,通过更新的荟萃分析评估了生命早期烟草吸烟暴露与IBD风险之间的关联。其次,通过进行表观遗传MR分析,探讨了生命早期吸烟暴露相关的DNA甲基化在IBD发病机制中的潜在作用。表观遗传MR分析中识别的显著基因座通过外部IBD表观基因组关联研究、共定位分析以及肠道组织中的基因表达分析和单细胞分析进行了验证。最后,我们对本研究的结果与我们之前关于成人吸烟的研究进行了比较分析,以探讨生命早期和成人期吸烟暴露在IBD发病机制中潜在共享的表观遗传途径。
6.2 英国生物银行前瞻性队列研究
主要暴露是参与者是否暴露于MSDP以及个人开始吸烟的年龄,疾病结局是CD、UC和IBD的发病率。协变量包括招募年龄、性别、汤森剥夺指数(TDI)、评估中心、基线阿司匹林使用情况、基线糖尿病和动脉高血压、饮酒状况、主动吸烟状况(仅针对MSDP分析)、体力活动、饮食评分、体重指数(BMI)以及前十个遗传主成分。最终分别有495,075名(3,736例发病事件)、492,425名(1,086例发病事件)和493,759名(2,420例发病事件)个体被纳入IBD、CD和UC的分析。采用Cox回归模型评估个人开始吸烟年龄与CD和UC风险之间的关联。
6.3 队列研究的荟萃分析
本荟萃分析方案已在PROSPERO注册。生命早期在本研究中定义为成年期前,包括孕前、孕期、婴儿期、儿童期和青春期。两名研究者独立检索了三个电子数据库(Medline、Embase和Web of Science),从建库至2024年11月,以识别调查生命早期烟草吸烟暴露与IBD风险关联的队列和病例对照研究。采用固定效应或随机效应荟萃分析来确定合格队列研究的合并估计值及其95%置信区间(CI)。使用I2评分评估异质性,并通过漏斗图和Egger检验评估发表偏倚。
6.4 表观遗传孟德尔随机化分析
进行MR分析时需考虑三个关键假设。为了识别与生命早期吸烟暴露相关的CpG位点,我们全面筛选了相关的EWAS,并从相应的EWAS中提取了与MSDP、父系吸烟导致的产前暴露以及祖母吸烟导致的产前暴露显著相关的CpGs。接下来,我们从GoDMC检索了与每个上述CpG位点最显著相关的mQTLs,作为其工具变量。我们选择了与每个CpG位点在全基因组显著性水平上相关的cis-mQTLs(mQTL与CpG位点距离<1MB),并进行了连锁不平衡(LD)聚类以筛选独立的工具变量。为了研究生命早期吸烟暴露相关的DNA甲基化在IBD发展中的潜在因果作用,我们将每个CpG位点视为一个暴露,并使用其代理mQTLs作为工具变量。随后,使用Wald比率法计算了每个CpG位点DNA甲基化对CD或UC风险每增加一个标准差(SD)的效应估计值。
6.5 炎症性肠病表观基因组关联研究
我们对CD或UC个体进行了EWAS,以识别差异甲基化基因座。该EWAS使用IBD-CHARACTER起始队列进行。随后,我们将表观遗传MR分析的结果与IBD EWAS的结果进行了比较,以验证所识别基因座的稳健性。
6.6 共定位分析和肠道组织基因表达分析
为了研究DNA甲基化水平与IBD风险之间的关联是否由共享的因果变异驱动,对所有在IBD EWAS或我们之前研究中得到验证的基因座进行了共定位分析。使用R软件中的“coloc”包进行此分析。我们进一步利用EWAS Data Hub的数据,通过线性回归分析研究了DNA甲基化对结肠组织中基因表达的调控模式。
6.7 肠道组织单细胞RNA测序分析
为了阐明目标基因在不同细胞亚型中的分布模式,我们使用Seurat包分析了RNA-seq数据集GSE214695中的基因表达谱。使用SingleR包根据已建立的标记基因进行细胞类型注释。然后比较了UC和CD组织与正常结肠组织相比,目标基因表达水平及其在不同细胞亚型中的比例分布。