编辑推荐:
为解决免疫细胞发育在表观遗传学层面的问题,加拿大曼尼托巴大学的 Meaghan J. Jones 等人研究脐带血与成人白细胞 DNA 甲基化差异。结果显示二者存在显著差异,反映免疫细胞成熟。该研究对理解免疫发育意义重大,推荐科研人员阅读。
加拿大曼尼托巴大学(University of Manitoba)的 Meaghan J. Jones 等人在《Communications Biology》期刊上发表了题为 “DNA methylation differences between cord and adult white blood cells reflect postnatal immune cell maturation” 的论文。该研究对于深入理解免疫系统在表观遗传学层面的发育机制、优化基于 DNA 甲基化(DNAm)的研究方法以及推动新生儿和成人免疫相关疾病的研究具有重要意义。
研究背景
DNA 甲基化在细胞发育过程中起着关键作用,它参与细胞功能成熟、谱系分化以及命运决定。一方面,随着细胞分化和功能发展,特定细胞类型的 DNA 甲基化会随时间发生变化;另一方面,不同终末分化细胞具有独特的 DNA 甲基化图谱。全血包含多种髓系和淋巴系细胞,免疫系统在早期生命中的发育与长期健康结局密切相关,因此研究从出生到成年 DNA 甲基化图谱的变化,有助于揭示免疫系统在表观遗传学和基因调控基础层面的成熟机制。
脐带血是研究早期生命免疫系统变化常用的非侵入性胎儿组织来源,因其采集方便且许多医院已开展脐带血库项目,大量表观遗传学研究对其 DNA 甲基化进行了评估。然而,脐带血和成人血在细胞组成上存在显著差异。脐带血白细胞绝对计数更高,含有更多自然杀伤(NK)细胞、单核细胞、调节性 T 细胞(Tregs)和幼稚 T 细胞,还富含有核红细胞(nRBCs),而成年红细胞则无细胞核。同时,脐带血表达独特蛋白质,如胎儿血红蛋白,且髓系和淋巴系细胞功能也与成人不同,新生儿对先天免疫依赖更强,适应性免疫细胞需接触病原体才能成熟并产生功能性记忆。
这些功能上的差异在一定程度上反映在 DNA 甲基化的变化中。此外,现有针对成人全血设计的计算工具,在分析新生儿或儿童全血的高维 DNA 甲基化数据时可能效果不佳,例如基于 DNA 甲基化的细胞类型反卷积算法,在处理脐带血数据时表现较差,部分脐带血细胞类型难以准确预测。因此,研究人员开展此项研究,旨在从表观遗传学角度细化细胞分类,深入理解各细胞类型成熟过程中的生物学差异。
研究方法
- 数据集合并:研究人员整合了两个成人数据集(Reinius 参考数据集和 Salas 参考数据集)以及四个脐带血数据集(de Goede 参考数据集、Bakulski 参考数据集、Gervin 参考数据集和 Lin 参考数据集)。这些数据集分别基于 Illumina Infinium Human Methylation BeadChip 平台的 450K 和 850K 芯片,通过 R 包中的函数进行合并,仅保留两个平台共有的 404,779 个 CpG 位点用于后续预处理。
- 数据预处理:对合并后的数据进行一系列质量检查,利用阵列上的控制探针评估技术参数,通过特定函数检测样本离群值,并检查 nRBC 污染情况。之后,使用 R 包中的函数进行背景校正、归一化处理,去除 SNP 探针、XY 探针、多态性探针和交叉杂交探针,以及检测 p 值大于 0.01 且在 5% 样本中表现不佳的探针,最终保留 389,901 个探针用于进一步分析。
- 无监督聚类和主成分分析(PCA):基于样本的甲基化 beta 值构建欧氏距离矩阵,采用完全连锁法生成树形图进行无监督聚类,同时进行轮廓分析评估聚类效果。利用 R 中的 prcomp () 函数对数据集进行 PCA,通过计算每个细胞类型中 beta 值标准差大于 0.05 的位点数量来评估变异性。
- 全基因组关联研究(EWAS):对成人和分选后的脐带血数据集进行 EWAS 分析,使用 R 中的 limma 包,以脐带血和成人血作为分类变量,对数据进行归一化处理,设定 p 值小于 9×10??且平均绝对 DNA 甲基化差异为 0.1(10%)作为判断显著 CpG 位点的标准。
- 共甲基化区域(CMR)分析和甲基化数量性状位点(mQTL)鉴定:运用 R 中的 CoMeBack 包,基于默认设置和 0.3 的斯皮尔曼相关系数阈值,在脐带血和成人血中以细胞类型特异性的方式识别 CMR。通过访问已发表的 ARIES(ALSPAC)mQTL 数据集,研究遗传因素对差异甲基化位点的影响。
- 基因本体(GO)和 ChromHMM 富集分析:借助 R 中 missMethyl 包的 gometh () 函数,对脐带血和成人血细胞类型之间差异甲基化 CpG 相关基因进行生物学过程的富集分析。同时,利用 ChromHMM 生成的染色质状态图谱,进行染色质状态的富集分析。
- 表观遗传年龄分析:分别计算成人样本的表观遗传年龄和脐带血样本的表观遗传 gestational 年龄。对于已知年龄的样本,通过线性回归计算年龄加速;对于未知年龄的样本,直接使用计算出的表观遗传年龄,并通过 ANOVA 检验判断细胞类型之间表观遗传年龄加速或表观遗传年龄是否存在差异。
研究结果
- 脐带血和成人白细胞 DNA 甲基化聚类差异:研究人员合并多个已发表的脐带血和成人血数据集后进行分析。通过对 389,901 个 CpG 位点的无监督层次聚类发现,样本首先按髓系(粒细胞、单核细胞)和淋巴系(B 细胞、T 细胞、NK 细胞)聚类,髓系细胞内样本再按年龄和特定细胞类型聚类,淋巴系细胞则先按细胞类型再按年龄聚类。成人淋巴细胞中的一小部分最为独特,其次是 nRBCs。在脐带血样本中,CD4 T 和 CD8 T 细胞聚为一大组,主要按个体而非细胞类型配对。轮廓分析显示,除 NK 细胞外,按细胞类型和年龄聚类的轮廓得分更高,其中 CD4 T 成人和 CD8 T 脐带血及成人血细胞在按细胞类型和年龄聚类时得分尤其高,表明这两种细胞类型中脐带血和成人血细胞差异明显。
- 成人淋巴细胞 DNA 甲基化变异性更高:主成分分析(PCA)结果显示,前六个主成分解释了超过 80% 的方差,第一主成分将髓系和淋巴系分开,第二主成分区分了脐带血和成人血样本。整体上,髓系细胞在各主成分上的聚类比淋巴系细胞更紧密。进一步观察发现,成人淋巴系细胞在主成分上的变异性高于髓系细胞,也高于相应的脐带血淋巴细胞。通过定义变异性位点(beta 值标准差大于 0.05),研究人员发现除粒细胞外,所有细胞类型在成人血中的变异性位点都多于脐带血,其中 B 细胞、CD8 T 细胞和 NK 细胞的变异性显著高于粒细胞和单核细胞。
- 不同细胞类型 DNA 甲基化差异显著:在对六种常见细胞类型(CD4 T、CD8 T、NK、B、粒细胞和单核细胞)进行 EWAS 分析后,研究人员发现大量 CpG 位点在脐带血和成人血之间存在差异甲基化。在纯化细胞类型中,所有六种类型的样本间有 5010 个 CpG 位点差异甲基化,淋巴系和髓系分别有 11,641 和 1741 个特异性差异甲基化 CpG 位点。通过 CoMeBack 算法分析发现,不同细胞类型中,31.5 - 43.8% 的脐带血差异甲基化位点和 46.3 - 52.66% 的成人血差异甲基化位点包含在 CMR 中,且大多数鉴定出的 CMR 是 2 - CpG CMR,NK 细胞中还发现了高达 53 - CpG 的 CMR,约 30% 的差异甲基化位点在脐带血和成人血样本的 CMR 中都存在。
- 差异甲基化位点的功能富集和基因组特征:对差异甲基化 CpG 位点相关基因进行 GO 富集分析,结果显示淋巴系细胞中,差异甲基化相关基因富集在免疫效应过程调节、T 细胞激活调节、免疫反应负调节和离子稳态等 181 个生物学过程;髓系细胞中,则富集在白细胞分化、免疫反应激活信号转导、细胞对细胞因子刺激的反应、免疫反应正调节和抗原受体介导的信号通路等 114 个生物学过程。在染色质状态富集分析中,淋巴系和髓系细胞的差异甲基化 CpG 位点均在弱抑制多梳、抑制多梳、双价增强子、双价转录起始位点(TSS)、活性增强子和弱增强子区域富集,但淋巴系细胞还在静止 / 低染色质状态富集,髓系细胞在基因增强子区域富集。此外,研究人员还发现不同细胞类型在 CpG 岛状态和基因组区域的富集存在显著差异,如 B 细胞中更多 CpG 位点映射到高密度(HC)岛,而其他细胞类型则相反。
- 表观遗传年龄估计存在细胞类型差异:研究人员发现部分脐带血和成人细胞类型之间的 DNA 甲基化差异与表观遗传时钟捕获的年龄相关变异有关。在所有细胞类型、淋巴系和髓系细胞中,分别有 29/5010、12/11,641 和 4/1741 个差异甲基化位点也在表观遗传时钟中。通过计算不同样本的表观遗传年龄和年龄加速,研究人员发现脐带血中,使用 Bohlin 时钟和 Knight 时钟计算时,单核细胞的表观遗传年龄最大,B 细胞和粒细胞在两个时钟估计中的差异最大;在成人血中,不同细胞类型的表观遗传年龄加速在三个成人表观遗传时钟中有显著差异,但模式不如脐带血清晰,只有 Hannum 时钟显示出特定细胞类型差异,CD8 T 细胞的表观遗传年龄被低估。
- 交互式网络工具助力研究:为方便科研人员查询脐带血和成人血细胞之间的全基因组差异,研究人员创建了一个名为 CoADD(Cord blood and Adult blood DNAm Differences)的交互式网络应用程序(https://rasiimwe.shinyapps.io/CoADD_KoborLab/)。该工具基于 Illumina 的 450K 阵列,科研人员可通过输入单个或多个 CpG 位点,查询其在不同细胞类型中脐带血和成人血之间的差异甲基化模式,有助于解释 DNA 甲基化研究结果。
研究结论与讨论
这项研究深入探讨了脐带血和成人血细胞之间 DNA 甲基化的内在生物学差异,为理解 DNA 甲基化变化如何反映免疫细胞成熟提供了重要依据。研究发现,淋巴细胞在脐带血和成人血中的 DNA 甲基化图谱差异明显,这可能与淋巴细胞出生后因抗原暴露而获得免疫记忆有关,表明 DNA 甲基化在免疫细胞成熟或维持成熟状态中发挥着重要作用。因此,在将基于成人样本开发的 DNA 甲基化工具应用于脐带血等胎儿样本时应谨慎。
同时,研究还观察到不同免疫细胞类型的表观遗传时钟预测年龄存在差异,这在脐带血和成人血中均有体现,但背后的生物学机制尚需进一步研究。研究人员创建的 CoADD 工具为科研人员提供了便利,有助于他们在免疫细胞类型差异的背景下解读 DNA 甲基化结果,推动相关领域的研究进展。
不过,该研究也存在一些局限性。例如,粒细胞主要由中性粒细胞(>95%)、嗜酸性粒细胞和嗜碱性粒细胞组成,尽管研究表明嗜酸性粒细胞和嗜碱性粒细胞对粒细胞 DNA 甲基化模式的影响较小,但仍不能完全排除其组成差异对结果的影响。此外,脐带血和成人血样本的分选策略不同,可能会影响细胞的纯度、活力和 DNA 甲基化模式,尽管部分结果显示这种影响有限,但仍需进一步关注。而且,研究中脐带血和成人血样本来自不同数据集和个体,存在遗传差异和批次效应,虽采取了一些措施减少影响,但仍无法完全消除。未来的研究可以进一步优化实验设计,更全面地控制这些因素,从而更深入地揭示免疫细胞成熟与 DNA 甲基化之间的关系,为免疫相关疾病的诊断、治疗和预防提供更坚实的理论基础 。