小鼠着丝粒与着丝粒周区的高分辨率基因组和表观基因组图谱解析

《Nature Communications》:Genomic and epigenomic maps of mouse centromeres and pericentromeres

【字体: 时间:2025年11月04日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对小鼠着丝粒和着丝粒周区高度重复序列难以组装和注释的难题,利用最新的端粒到端粒(T2T)组装草案和Hifiasm组装,结合CUT&RUN-seq、DNA甲基化分析和RNA-seq等技术,首次绘制了这些区域的高分辨率基因组和表观基因组图谱。研究发现大多数着丝粒含有高阶重复(HORs),着丝粒相比着丝粒周区呈现低甲基化状态,CENP-A在120-mer小卫星(MiSats)中高度富集,而同源大卫星(MaSats)富含H3K9me3修饰。该研究为理解卫星DNA生物学及其在染色体稳定性中的作用提供了关键见解,将推动完整注释的小鼠T2T组装的发展。

  
在真核生物基因组中,重复序列约占哺乳动物基因组的50%,是维持基因组结构和功能完整性的重要组成部分。其中,卫星DNA作为串联重复序列,主要位于染色体的着丝粒、着丝粒周区和端粒等特定区域,在维持染色体稳定性、促进细胞分裂中的染色体分离以及保护染色体末端等方面发挥着至关重要的作用。小鼠基因组中卫星DNA约占11%,但其着丝粒和着丝粒周区由于高度重复和序列同源性高,一直难以进行精确组装和表征,这限制了对这些关键基因组区域功能的深入理解。
与人类着丝粒表现出高变异的α-卫星不同,小鼠着丝粒主要由120个碱基对重复单元的小卫星(Minor Satellites, MiSats)组成,而着丝粒周区则包含234个碱基对重复单元的大卫星(Major Satellites, MaSats)。尽管小鼠是遗传学和生物医学研究中广泛使用的模式生物,但其基因组仍缺乏对这些高度重复区域的完整表征和注释图谱。近期,两个独立的小鼠端粒到端粒(Telomere-to-Telomere, T2T)组装草案的发布,为全面解析小鼠卫星区域提供了及时的资源和契机。
为了填补这一知识空白,研究人员开展了系统性研究,利用最新的小鼠T2T组装草案,结合从C57BL/6J品系小鼠肾脏组织生成的PacBio HiFi reads组装的Hifiasm contigs,创建了详细、完整注释的小鼠着丝粒、着丝粒周区和卫星连接处的基因组和表观基因组图谱。这项研究发表在《Nature Communications》杂志上,为卫星DNA生物学提供了重要见解,并将推动完整注释的小鼠T2T组装的发展,类似于当前人类的T2T组装。
研究团队采用了多种先进的技术方法:利用PacBio Revio测序平台生成高质量HiFi数据,通过Hifiasm组装器构建基因组;运用CUT&RUN-seq技术分析CENP-A、CENP-B、H3K9me3和H3K27me3等染色质标记的富集模式;基于PacBio HiFi reads动力学特征进行DNA甲基化分析;对C57BL/6J小鼠组织进行RNA测序(RNA-seq)以解析这些区域的转录情况;使用RepeatMasker和NCBI BLAST进行重复序列注释;通过StainedGlass软件生成序列同一性热图;利用CENdetectHOR工具鉴定高阶重复(HORs)。
完全注释的小鼠着丝粒和着丝粒周区基因组图谱
研究人员发现小鼠着丝粒大小从90 Kb到约1.2 Mb不等,与人类着丝粒(500 Kb至5 Mb)相似。大多数着丝粒含有120-mer MiSats,而含有高密度长度变异(112-mers和112-64二聚体MiSats)的大块区域与少数染色体的着丝粒周区相邻。着丝粒周区大小从2.2 Mb到23 Mb不等,主要由同源MaSats组成,而 divergent MaSats优先位于着丝粒周区内的非卫星重复岛附近或着丝粒周区-染色体臂连接处。
着丝粒和着丝粒周区表现出不同的序列同一性模式
通过创建StainedGlass热图分析卫星区域的序列同一性,发现最高同一性出现在着丝粒中,在着丝粒周区中降低,在着丝粒周区-染色体臂连接处进一步降低。在着丝粒内,112-64二聚体MiSat阵列表现出最高的序列同源性(95-100%),其次是120-mer MiSat阵列(75-100%),然后是Y着丝粒(70-80%)。
大多数小鼠着丝粒含有高阶重复(HORs)
使用CENdetectHOR工具,在除Cen3和Cen4外的所有T2T着丝粒上检测到HORs,这两个着丝粒是小鼠中最同源的着丝粒。HORs被标记为H2到H45,其中数字代表给定HOR中单体单元的数量。研究发现,由较短重复单元组成的HORs,如二聚体(H2)和三聚体(H3),比由较长重复单元组成的HORs更常见。
非卫星重复以单个元素形式存在于着丝粒中,并在着丝粒周区扩展成簇状岛
非卫星重复序列(包括LTR逆转录转座子、LINEs、SINEs和简单重复)在着丝粒和着丝粒周区卫星区域中以单个元素或形成岛的簇形式存在。单个元素在着丝粒和着丝粒周区中都存在,而岛仅存在于着丝粒周区和侧翼区域。每个岛的长度可达约200 Kb。
Divergent MaSats优先位于非卫星岛和着丝粒周区-染色体臂连接处附近
研究发现,大块的高密度divergent MaSats位于染色体臂连接处附近。Divergent MaSats的密度从着丝粒-着丝粒周区连接处向染色体臂方向的着丝粒周区末端增加。此外,长的 stretches of high-density divergent MaSats 也出现在着丝粒周区非卫星重复岛附近。
着丝粒周区比着丝粒区域表现出更高的DNA甲基化
在人类中,着丝粒区域含有局部减少的DNA甲基化区域,称为着丝粒缺失区域(centromere dip regions, CDRs),这些区域局限于活跃的CENP-A富集的α卫星阵列。研究发现,着丝粒周区MaSats在所有卫星区域中表现出最高的DNA甲基化,而着丝粒MiSats表现出明显的DNA甲基化减少。然而,与人类活跃着丝粒中几乎无DNA甲基化的明显下降相比,着丝粒contigs中DNA甲基化的减少不太明显。
只有一小部分卫星转录成RNA
RNA测序分析显示,只有一小部分MiSat和MaSat被转录,它们的转录水平比卫星中间散在的rDNA基因的表达低几个数量级。来自高密度divergent MaSat-containing区域的转录仅限于中间散在的非卫星重复。此外,同源MaSats中间散在的元件比高密度divergent MaSats中的元件表现出更高的表达水平。研究发现具有高转录水平的卫星与低CpG甲基化密度相关。
着丝粒和着丝粒周区及连接处显示出不同的染色质富集模式
CUT&RUN sequencing数据分析显示,含有120-mer MiSats的区域表现出最高的CENP-A富集,而含有112-mers和112-64-dimers的contigs显示出较低的富集。尽管CENP-A富集较低,但112-64二聚体MiSats在所有分析的卫星contigs中表现出最高的CENP-B富集。同源MaSats持续富含H3K9me3,而高密度divergent MaSats显示出更不连续的H3K9me3富集,但这些divergent MaSats与同源MaSats相比富含更高水平的H3K27me3。
序列依赖性对着丝粒和着丝粒周区染色质的贡献
研究发现,着丝粒MiSats中含有17 bp的CENP-B box motif,其密度与CENP-A和CENP-B蛋白的富集呈正相关。在112-64二聚体区域中,经典CENP-B box的密度最高,而在120-mer MiSats中,变异CENP-B box的密度增加。在着丝粒周区,Major motif的密度与divergent MaSats的密度成反比,H3K9me3富集与MaSat motif密度呈正相关,而H3K27me3表现出负相关关系。
这项研究通过对小鼠着丝粒和着丝粒周区的综合分析,揭示了这些关键基因组区域的序列特征、表观遗传调控和功能组织的重要见解。研究发现大多数小鼠着丝粒含有高阶重复,但相比人类着丝粒,其HORs丰度较低,反映了小鼠卫星序列的高度同源性。着丝粒相比着丝粒周区呈现低甲基化状态,但不像人类着丝粒那样有明显的着丝粒缺失区域,这可能反映了物种间着丝粒进化成熟度的差异。
研究还发现染色质状态与卫星序列特征密切相关:CENP-A在120-mer MiSats中高度富集,而同源MaSats富含组成性异染色质标记H3K9me3,而divergent MaSats则与兼性异染色质标记H3K27me3相关。这种序列依赖性的染色质组织方式为理解着丝粒和着丝粒周区的功能特化提供了分子基础。
该研究生成的综合基因组和表观基因组图谱为完整注释小鼠T2T组装奠定了基础,类似于当前人类的T2T组装。这些资源将促进未来旨在深入了解小鼠着丝粒和着丝粒周区功能机制的研究,对理解染色体生物学、基因组稳定性和相关疾病具有重要意义。研究揭示的序列变异、染色质状态和表观遗传修饰之间的复杂关系,为探索卫星DNA在细胞分裂、基因调控和基因组进化中的作用提供了新的视角。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号