编辑推荐:
为解决遗传与表观遗传变异关系研究受环境因素干扰及缺乏标准化模型的问题,华盛顿大学圣路易斯分校研究人员开展 iPSCs 相关研究。发现 iPSCs 阶段两者关联强,分化后变弱等。该研究为疾病机制研究提供新视角,值得一读。
在生命科学的神秘世界里,基因和表观遗传就像一对紧密合作却又偶尔闹别扭的伙伴,它们之间的互动关系一直是科学家们热衷探索的谜题。我们知道,每个细胞都带着相同的遗传模板,就像每个人都拿着同一份建筑蓝图,但最终却能形成数百种功能、形态各异的细胞,这背后离不开表观遗传的调控。比如,组蛋白修饰、DNA 甲基化和染色质可及性这些表观遗传特征,就像是一群勤劳的小工匠,决定着哪些基因该在细胞里表达,进而塑造细胞的功能和再生潜力。
而且,基因型和表观遗传机制之间的相互作用对细胞的功能至关重要。就拿 SHH 基因来说,与之相连的增强子发生去甲基化,就可能导致多指畸形;DNMT3A 基因发生突变,会减少从头甲基化,让癌症病情雪上加霜。尽管基因组和表观基因组之间的相互作用在基因调控和疾病病因研究中备受关注,但目前仍缺少标准化的全基因组研究模型,这就好比探索宝藏时却没有一张准确的地图,使得我们对基因调控的分子机制了解得还不够透彻。
另外,在研究表观遗传变异、遗传变异和基因表达之间的关系时,环境因素就像一个爱捣乱的 “小调皮”,总是出来混淆视听。阳光、饮食和各种环境暴露都会影响转录和 DNA 甲基化等表观遗传特征。经典的表观遗传研究发现,几代人前的饥饿事件居然都能影响到现在人的 DNA 甲基化模式,这就意味着,如果想要在人群层面研究表观遗传对转录的影响,就得把个体从出生前甚至受孕前的所有环境暴露因素都考虑进去,这难度简直就像要数清天上的星星一样,让研究变得困难重重。
为了攻克这些难题,来自华盛顿大学圣路易斯分校(Center for Genome Sciences & Systems Biology、Department of Genetics、Genome Engineering & Stem Cell Center (GESC@MGI) 等部门)的研究人员另辟蹊径,他们把目光投向了人类诱导多能干细胞(iPSCs)。iPSCs 就像是生命的 “万能种子”,它可以从体细胞(比如肾上皮细胞)重新编程而来,拥有和胚胎干细胞相似的分化潜能。而且,iPSCs 在重编程过程中,转录因子结合、染色质状态和 DNA 甲基化都会发生变化,并且即使经过重编程,它依然保留着供体特异性的 DNA 甲基化和基因表达特征,这就为研究遗传和表观遗传变异的关系提供了一个绝佳的模型。
这些研究人员在《Nature Communications》期刊上发表了题为 “iPSCs and iPSC-derived cells as a model of human genetic and epigenetic variation” 的论文。他们通过研究发现,在 iPSC 阶段,表观遗传变异与遗传变异的关联最为紧密,而随着细胞分化,这种关系逐渐变弱;细胞类型对表观遗传变异的影响比遗传变异更大;同时,研究 iPSCs 及其衍生细胞的表观遗传变异,有助于确定全基因组关联研究(GWAS)中的重要位点以及这些位点发挥作用的细胞类型。这一研究成果为深入了解遗传和表观遗传变异的关系提供了新的视角,也为疾病机制研究和药物开发等领域带来了新的希望。
在研究过程中,研究人员运用了多种关键技术方法。他们通过深度测序技术,对 iPSCs 及其分化细胞进行全基因组测序(WGS)、全基因组亚硫酸氢盐测序(WGBS)、染色质可及性测序(ATAC-seq)和 RNA 测序(RNA-seq),从而获取大量的基因组、表观基因组和转录组数据;使用个性化基因组映射策略,用 vcf2diploid 编辑 hg38,创建个性化参考基因组,以此减少参考偏差;利用主成分分析(PCA)和引导分层聚类等数据分析方法,探究不同细胞类型和供体之间的遗传和表观遗传差异。
下面让我们详细看看研究人员都取得了哪些成果。
表观遗传变异随细胞分化增加,与遗传变异的直接关系变弱
研究人员从三位供体(一对父女 M1 和 F1,以及一位无关女性 F2)的尿液中收集肾上皮细胞,并将其重编程为 iPSCs。对这些 iPSCs 及其分化而来的神经干细胞(NSC)、运动神经元和单核细胞进行基因表达、染色质可及性和 DNA 甲基化检测。
通过主成分分析和引导分层聚类发现,染色质可及性、DNA 甲基化和基因表达更多地依赖于细胞类型,而非供体来源。在 iPSCs 中,CpG 甲基化具有供体依赖性,同一供体来源的细胞系在主成分分析中会聚集在一起。计算不同细胞系之间的差异甲基化区域(DMRs)发现,同一供体来源的细胞系之间 DMRs 较少,而相关供体和无关供体来源的细胞系之间 DMRs 较多,这表明 iPSCs 保留了与遗传变异可能相关的供体特异性表观基因组。
此外,与 iPSCs 相比,分化细胞通常具有更多的差异表达基因、差异可及性染色质峰和差异甲基化区域,但这些差异在不同供体关系的细胞系之间并不总是呈现出明显的规律。在主成分分析中,iPSC 和 NSC 样本聚类最紧密,而运动神经元和单核细胞样本相对分散,这与不同细胞类型的多能性程度变化相符。同时,同一供体来源的 iPSCs 在某些方面也存在差异,这体现了 iPSC 重编程和分化过程中的不确定性。
表观遗传变异在 iPSCs 中比在分化细胞中与遗传变异的关联更强
研究人员识别出每位供体相对于 hg38 的遗传变异,以及供体之间的遗传变异差异。他们发现,父亲和女儿供体(M1 和 F1)之间的遗传变异比无关供体之间少,大约是无关供体的三分之二。
接着,研究人员探究遗传变异与表观遗传变异直接重叠的频率,以及在不同基因组背景下这种关系的强弱。通过计算优势比(odds ratio)发现,在 iPSCs 中,染色质可及性与遗传变异的直接关系在不同样本比较中有所不同,但总体而言,全基因组范围内,与遗传变异重叠的差异可及性峰比不重叠的更有可能出现;在启动子区域,这种优势比降低,而在 ChromHMM 静息区域则增加。中等(20bp - 50bp)和大(>50bp)的插入缺失(INDELs)与差异可及性峰的关联在全基因组范围内最大。
然而,在分化细胞中,遗传变异与差异可及性的总体关系比 iPSCs 中弱得多,INDELs 与差异可及性峰的关系在分化细胞中也明显减弱。与染色质可及性相比,DNA 甲基化与遗传变异的关联在全基因组范围内较弱,但在不同细胞类型中,差异甲基化与遗传变异的关联模式相似。
遗传变异和表观遗传变异的相互作用可能是基因表达变化所必需的
研究人员进一步研究染色质可及性和 DNA 甲基化的差异是否与基因表达差异相关。在 iPSCs 中,他们发现差异表达基因与差异可及性和 / 或差异甲基化区域的直接重叠率在 0.8% - 14% 之间,重叠表观遗传变异的基因平均表达差异更大。利用人类诱导多能干细胞计划(HipSci)研究中的表达数量性状位点(eQTLs)数据发现,与 HipSci eQTLs 重叠且差异可及的基因,其表达差异往往更大。
以 ZSCAN1 基因为例,它在 F1 和 M1 来源的 iPSCs 中表达,而在 F2 来源的 iPSCs 中表达较弱。F2 的 ZSCAN1 基因启动子区域发生甲基化且不可及,这可能导致了表达差异。同时,该基因启动子上的 SNP rs495839 被 HipSci 鉴定为 eQTL,与基因表达差异相关。这表明遗传变异与染色质可及性和 DNA 甲基化差异相互作用,可能导致基因表达差异。
与遗传变异直接相关的表观遗传变异并不更可能在多种细胞类型中维持
研究人员曾假设,与遗传变异直接相关的表观遗传变异更可能在多种细胞类型中普遍存在。但研究结果却出乎意料,在全基因组亚硫酸氢盐测序(WGBS)数据中,与遗传变异重叠的差异甲基化区域(DMRs)在多种细胞类型中差异甲基化的比例较低,不重叠遗传变异的 DMRs 在多种细胞类型中差异甲基化的比例反而更高。在差异可及性 ATAC 峰和差异表达基因方面,与遗传变异重叠的也并不更可能在多种细胞类型中共享。这说明遗传变异并不会以非细胞类型特异性的方式直接影响细胞的甲基化或可及性。
基于 iPSC 系统研究疾病机制的实用性:GWAS 性状的细胞类型特异性富集因潜在遗传变异的存在与否而异
为了探究 iPSC 系统在研究疾病机制方面的实用性,研究人员基于染色质可及性,利用连锁不平衡分数回归(LDSC)分析,探索能否识别与 GWAS 性状相关的 SNP 所在的细胞类型,以及 GWAS 性状相关位点在有或无遗传变异的 ATAC 峰中的富集情况。
在来自供体 F2(欧洲血统)的细胞中,对于一些神经学性状(如注意力缺陷多动障碍、自闭症、失眠、重度抑郁症、精神分裂症),运动神经元的 ATAC 峰中与性状相关的位点比其他细胞类型更富集;在 F1 和 M1(东亚血统)的细胞中,运动神经元的 ATAC 峰对精神分裂症相关位点有强烈富集。同时,研究人员还发现单核细胞的 ATAC 峰对免疫相关性状(如单核细胞计数相关 SNP)有富集。
进一步分析发现,在 F2 的细胞中,一些性状在差异可及的 ATAC 峰中有细胞类型特异性的位点富集;在运动神经元中,没有遗传变异的 ATAC 峰更可能与多种神经学性状相关的位点重叠。例如,SNP rs4453556 与多种神经学表型相关,位于运动神经元可及区域且上游有 NPTX1 和 RPTOR 基因,F2 在该 SNP 处为纯合替代,其运动神经元中 NPTX1 表达较低,这表明 iPSC 和 iPSC 衍生细胞的表观基因组数据有助于探究疾病机制。
总的来说,这项研究利用 iPSCs 及其衍生细胞,全面地描绘了遗传变异和表观遗传变异之间的直接相互作用。研究发现 iPSCs 保留了一些可能与遗传变异相关的供体特异性表观遗传特征,但在分化过程中这些特征通常不会被保留。在分化细胞中,表观遗传变异和基因表达变异增加,但与遗传变异的直接关系在全基因组范围内变弱。遗传变异和表观遗传变异的相互作用能够影响基因表达,但基因表达的变化比简单的差异甲基化或染色质可及性的直接重叠要复杂得多,这也为后续研究提出了更高的要求,需要更大的样本量和更多的基因组数据模式来深入探究。
此外,研究还揭示了研究 iPSCs 及其衍生细胞的表观遗传变异,对于确定 GWAS 研究中的重要位点以及这些位点发挥作用的细胞类型具有重要意义。这不仅为我们理解基因调控和疾病发生发展的机制提供了关键线索,也为未来的精准医疗、药物研发等领域开辟了新的方向,让我们朝着解开生命奥秘、攻克疑难疾病的目标又迈进了一大步。