单细胞多组学解码99%的基因组:了解阿尔茨海默症和帕金森症的非编码调控变异

【字体: 时间:2021年06月18日 来源:10x Genomics

编辑推荐:

  对于导致神经退行性疾病的潜在遗传失调,我们的认识在不断增加。而当推断的导致疾病的遗传错误出现在基因组的非编码序列时,这个任务就变得更加复杂。

美国时间6月7日,美国食品药品监督管理局(FDA)宣布批准渤健(Biogen)公司研发的阿尔茨海默症新药阿杜卡玛单抗(aducanumab,商品名Aduhelm)上市,但需要继续研究该药的临床效果。可以看到对于导致神经退行性疾病的潜在遗传失调,我们的认识在不断增加。而当推断的导致疾病的遗传错误出现在基因组的非编码序列时,这个任务就变得更加复杂。斯坦福大学的研究人员正在使用单细胞ATAC-seq来探索这些神秘的序列,并研究它们所含的调控元件如何导致阿尔茨海默病和帕金森病。


健康大脑和阿尔茨海默病重症患者大脑的比较
来源:美国国立卫生研究院,国家老龄化研究所

现代神经科学的先驱、诺贝尔奖获得者Santiago Ramón y Cajal博士在1906年的诺贝尔奖获奖演讲中谈道,“不幸的是,大自然似乎并没有意识到我们对便利和统一的理智需求,而是常常为复杂和多样而感到激动”(1)。Ramón y Cajal博士的这段话是用来形容健康的中枢神经系统中各种神经群体和相互连通的结构的,但也同样适用于神经病理学。阿尔茨海默症(AD)和帕金森症(PD)就是很好的例子。这些神经退行性疾病是由环境因素、生活方式和多个遗传变异(包括存在于传统定义基因之外的变化)共同导致的,但在很大程度上仍未被阐明。

当科学家试图破译神经退行性疾病的复杂遗传图谱时,他们必须努力解决那些发生在神秘的基因组非编码区中的遗传变异的影响。人类基因组由30亿个碱基对组成,包含20,000多个功能基因。不过,高达99%的基因组是由“非编码序列”组成的,这意味着它们在表达时不会产生功能蛋白。然而,请不要忽略这些神秘的序列。基因组的非编码区包含重要的调控元件,包括增强子和启动子,这些DNA区域为那些在不同的细胞群体中执行转录功能和控制基因表达模式的蛋白质提供结合位点。这些模式驱动细胞分化并影响细胞或生物系统的正常运行,或在失调时导致疾病发生。

阐明非编码序列中阿尔茨海默症和帕金森症的风险位点

解析这些非编码区域在疾病中的作用,不仅有助于了解疾病的机制,而且还有望精确定位潜在的治疗靶点。在最近的一项研究中,斯坦福大学的科学家M. Ryan Corces博士、Thomas Montine博士与Howard Chang博士合作,试图了解非编码调控变异对神经退行性疾病(包括AD和PD)的贡献。以往人们采用大规模的全基因组关联研究(GWAS)来研究基因组中的变异(单核苷酸多态性,SNP)与AD或PD临床表现之间的关联,并确定了多个风险位点。然而,这些位点中的许多位于基因组的非编码区域,因此其真正功能尚不清楚。例如,这些非编码序列中的SNP可能表明,考虑到物理相邻,最近的基因是潜在的疾病驱动因素。或者,非编码序列可能包含调控元件,以产生疾病特征的方式改变其他基因的表达(2)。此外,这些遗传变异存在于所有细胞的基因组中,因此很难确定哪些特定的细胞群体利用特定的非编码区来执行这些基因调控程序。

为了解析非编码变异在AD和PD中的功能作用,研究小组试图鉴定出有功能的非编码调控元件,这些元件可能受到之前GWAS鉴定出的疾病相关遗传变异的影响。首先,他们采用大量细胞ATAC-seq(染色质转座酶可接近性分析),对39名认知健康供体的7个不同脑区的染色质可接近性图谱进行了分析,这些脑区代表了不同大脑功能和细胞组成的区域,与神经退行性疾病相关。他们鉴定出186,559个染色质开放区域,表明了采样脑细胞的基因组中含有预期的调控元件。研究小组发现了证据,表明大脑特定区域中存在涉及到所有或大多数细胞类型的区域效应,从而突出了特定脑区中的特定细胞可能参与其中。因此作者转而通过单细胞分辨率来细化他们的分析。

通过单细胞ATAC-seq来解开非编码调控变异的谜团

他们采用单细胞ATAC-seq(scATAC-seq)对4个不同脑区的另外10个样本进行分析,总共有70,631个细胞。分析鉴定出24个细胞簇,并根据从每个簇的染色质可接近性数据中观察到的谱系定义关键基因的激活来分配已知的脑细胞类型。重要的是,大量细胞ATAC-seq检出的峰中有89%也通过scATAC-seq分析鉴定出,而scATAC-seq的峰只有34%与大量细胞ATAC-seq数据集中的峰重叠。这表明,在很难从包含多个不同细胞群的大块组织中鉴定出特定细胞类型的峰时,单细胞分析是有用的。另一个重要的发现是,从单细胞ATAC-seq数据检出的峰中,48%是单个类型的细胞所特有的,并且包含了丰度通常不太高的细胞类型的峰。总体而言,这些数据提供了一份强大的调控元件参考图,这些元件决定了各种成体脑细胞的身份,从少突胶质细胞到小胶质细胞再到神经元。


中枢神经系统中的四种不同类型的神经胶质细胞:室管膜细胞(浅粉色)、星形胶质细胞(绿色)、小胶质细胞(红色)
以及少突胶质细胞(在功能上类似于周围神经系统中的Schwann细胞)(浅蓝色)
来自Holly Fischer -
http://open.umich.edu/education/med/resources/second-look-series/materials - CNS Slide 4. (CC BY 3.0)

此外,这些有关细胞类型特异性的调控程序的信息支持了神经元亚群的精细注释。作者对原先的24个细胞簇开展分析,提取出所有标记为神经元的细胞,然后再次根据从单细胞ATAC数据中观察到的前瞻性谱系定义基因活性将其细分为30个不同的神经元簇,它们分别代表一种独特的细胞类型或状态。这不仅可以对同一脑区中的神经元进行颗粒化分类,包括投射到不同脑区的纹状体和纹状体中间多棘神经元,而且还可以揭示神经元细胞类型特有的峰、基因和转录因子活性。因此,从scATAC数据中获得的丰富信息可通过询问表观基因组特征,并进一步研究它们对同一单细胞中基因表达的影响,支持高度颗粒化的细胞类型注释。

最后,斯坦福大学的研究小组回到了与神经退行性相关的GWAS SNP,试图确定这些遗传变异位点是否与添加scATAC数据后鉴定出的任何染色质可接近性峰重叠,以及它们影响哪些特定的细胞类型和基因。借助机器学习方法,他们根据以下参数对与AD和PD相关的SNP进行打分,包括:与染色质开放区域的重叠;对预测的增强子-启动子相互作用的推测作用(之前已通过Hi-C文库制备和染色质免疫沉淀技术(HiChIP)和scATAC-seq技术鉴定);及其对转录因子结合能力的推测作用。反过来,这将揭示因SNP的存在而破坏的基因和分子过程,因此与AD和PD有关。重要的是,这种方法揭示了与多个AD关联基因有关的特定致病性SNP。例如,SLC24A4基因座包含46个SNP,但这项研究表明,一个存在于小胶质细胞特异性峰内的SNP破坏了SPI1基序,并与RIN3基因的启动子进行特异性通讯,RIN3基因在早期内吞通路中激活,该通路对小胶质细胞的功能至关重要。

此外,这项研究还表明,他们有望揭示非编码多态性在之前未与PD关联的基因中的作用。他们重点关注了ITIH1 GWAS位点,其中包含317个SNP。一个SNP出现在STAB1基因的小胶质细胞特异性的内含子调控元件中,该基因编码了一种跨膜受体蛋白,对淋巴细胞归巢和配体(如低密度脂蛋白)内吞作用必不可少。他们预测这个SNP会破坏该调控元件内的KLF4转录因子结合位点,进而破坏STAB1基因表达。总之,这些结果表明小胶质细胞中STAB1的表达失调可能是疾病的潜在原因。

明确非编码调控变异在疾病中的作用

非编码序列对健康和疾病的功能贡献也许不再神秘。正如这项与AD和PD相关的GWAS SNP研究所展示的,以单细胞分辨率测定染色质可接近性的能力为人们打开了一扇窗,可以深入了解那些以往不清楚的控制基因表达的非编码调控元件,并最终了解特定细胞群体的疾病表现。此外,对这些推测的增强子-启动子相互作用所涉及的转录因子功能的确认,包括将其活性与相同细胞中的基因表达模式直接关联,可扩大治疗靶点的选择,从而治疗AD、PD以及同样受到非编码变异影响的其他复杂疾病。


对基因组中染色质开放区域的了解可揭示驱动细胞身份和功能的关键调控元件。研究人员可通过
Chromium单细胞多组学ATAC + 基因表达来发现它们对特定细胞群体中基因表达的影响。
来源:10x Genomics

深入了解10x Genomics助力单细胞ATAC-seq和基因表达数据的整合分析的解决方案,请点击此处了解更多资源

参考资料:

1. S Ramón y Cajal. The structure and connexions of neurons.Nobel Lecture. (1906). https://www.nobelprize.org/uploads/2018/06/cajal-lecture.pdf.
2. MR Corces et al., Single-cell epigenomic analyses implicate candidate causal variants at inherited risk loci for Alzheimer’s and Parkinson’s diseases. Nat Gen. 52, 1158–1168 (2020).

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号