年轻KRAB锌指蛋白基因簇是小鼠中ERV驱动遗传异质性的高度动态孵化器

《Nature Communications》:Young KRAB-zinc finger gene clusters are highly dynamic incubators of ERV-driven genetic heterogeneity in mice

【字体: 时间:2025年11月01日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对小鼠进化年轻KRAB锌指蛋白(KZFP)基因簇组装不完整的问题,结合长读长测序技术开展比较基因组分析,发现内源性逆转录病毒(ERV)整合通过促进非等位基因同源重组驱动KZFP基因簇扩张和分化,同时揭示ERV通过片段复制而非逆转座增加其拷贝数的新机制,为理解宿主与转座子共进化提供了新视角。

  
在哺乳动物基因组中,KRAB锌指蛋白(KZFP)是最大的转录因子家族,它们通过其可变串联C2H2锌指阵列特异性结合DNA,并利用KRAB结构域招募异染色质形成复合物来沉默基因表达。尽管少数进化古老的KZFP在胚胎发育、基因组印记和减数分裂重组热点决定等核心生物学过程中发挥重要作用,但大多数KZFP,尤其是年轻的和物种特异性的成员,主要功能是抑制转座子(TE),特别是内源性逆转录病毒(ERV)。这种特异性抑制关系,以及跨物种研究中观察到的KZFP基因数量与ERV负荷之间的显著相关性,共同支持了KZFP与ERV协同进化的模型。然而,新的KZFP基因是否以及如何响应新的ERV入侵事件而出现,其具体机制尚不清楚。
小鼠谱系近期经历了多次小鼠特异性ERV的浸润,同时其KZFP基因库也发生了戏剧性扩张,拥有数百个物种特异性KZFP单元,这使其成为研究KZFP与ERV协同进化的理想模型。然而,由于现有基因组组装(如GRCm39)在年轻的KZFP基因簇区域存在大量序列缺口,严重阻碍了对这些基因座及其快速进化动态的全面解析。
为了解决这一难题,Melania Bruno、Sharaf M. Farhana等研究人员在《Nature Communications》上发表了他们的研究成果。他们利用PacBio HiFi和牛津纳米孔(ONT)长读长测序技术,对包括C57BL/6J (BL6J)、129S1/SvImJ (129S1) 和CAST/EiJ (CAST)在内的多个小鼠品系,以及Mus spretus和Mus pahari等鼠种进行了高质量的从头基因组组装,重点解析了染色体4(Chr4)末端的一个年轻KZFP基因簇。
研究人员发现,Chr4 KZFP基因簇的大小远超之前的估计。在BL6J品系中,该簇从参考基因组中的2.8 Mb扩展到5.4 Mb,揭示了超过2.5 Mb的此前未组装序列,并新注释了38个KZFP基因。更令人惊讶的是,该基因簇在129S1和CAST品系中甚至更大,分别达到6.9 Mb和6.6 Mb,且包含的KZFP基因数量(分别为83和86个)也多于BL6J(73个)。这些尺寸差异并非组装假象,因为独立的T2T(端粒到端粒)组装结果与本研究一致,表明这是品系间真实的遗传变异。
对不同小鼠品系和物种的Chr4 KZFP基因簇进行详细比较后,研究发现该区域存在高度的异质性。除了大小不同,基因簇内部的序列排列也发生了重大重排。更重要的是,通过分析KZFP蛋白的指纹氨基酸阵列(决定DNA结合特异性的关键氨基酸),发现仅有少量指纹阵列在不同品系间完全一致,绝大多数是品系特异的。这表明Chr4 KZFP基因簇在小鼠各品系中经历了平行进化,即独立的扩张和分化事件。
为了探究基因簇快速扩张的模式,研究人员分析了BL6J品系Chr4簇内KZFP基因3‘外显子的序列相似性。他们发现该簇的扩张并非单个基因的独立复制,而是通过包含多个KZFP基因的大片段重复(segmental duplication)实现的。这些重复的基因块大小从3到7个基因不等,并且内部还包含在重复事件发生前就已整合的转座子序列。这表明片段重复是驱动该基因簇快速扩张的主要机制。
那么,是什么因素促进了这些重组和片段重复事件呢?研究人员考察了染色体位置和减数分裂重组的影响。他们比较了位于端粒附近的Chr4、Chr2基因簇和靠近着丝粒的Chr12双基因簇。结果发现,Chr2簇在BL6J和129S1品系间几乎完全相同,而远离端粒的Chr12双簇却在所有三个Mus musculus品系中都表现出高度的异质性,甚至在Mus spretus中经历了巨大扩张。此外,年轻的KZFP基因簇并未富集PRDM9结合位点或减数分裂重组标志物DMC1,表明减数分裂重组并非这些位点序列分化的主要驱动力。相比之下,进化上更古老、保守的KZFP基因簇(如Chr6和Chr7上的簇)则显示出很高的序列保守性,且自身相似序列的负荷远低于年轻簇。
研究发现,年轻KZFP基因簇的扩张与转座子,特别是ERV的富集密切相关。与大鼠相比,小鼠的年轻KZFP基因簇(Chr4, Chr2, Chr12)获得了更高的LTR(长末端重复序列)元件负荷,而大鼠的对应区域则富含LINE(长散在核元件)元件。进一步分析发现,Chr4基因簇中高度富集的某些ERV家族(如MLTR18A_MM, LTRIS6等),其基因组中超过10%的拷贝都集中于此,而该簇仅占基因组的0.2%。尤为关键的是,对这些ERV的序列分歧度分析显示,基因簇内的ERV拷贝呈现出近乎一致的分歧度分组,这与基因组范围内连续的分歧度分布形成鲜明对比,强烈支持这些ERV是通过片段复制而非独立的逆转座事件实现富集的。研究人员还在基因簇内发现了嵌合LINE和ERV序列,这是非等位基因同源重组(NAHR)留下的“疤痕”,为重组机制提供了直接证据。
基于这些发现,研究人员提出了一个模型:新整合到KZFP基因簇中的ERV,通过其之间的微同源序列促进了非等位基因同源重组事件。这些重组事件的修复可能导致基因簇的片段重复(扩张)或缺失(收缩)。这些力量在不同小鼠品系中独立、平行地作用,加上品系和物种特异的ERV整合,共同驱动了年轻KZFP基因簇的分化。同时,片段重复也使得整合在重复区块内的ERV拷贝数增加,形成了一个ERV促进重组、重组又导致ERV富集的自我强化循环。
接下来,研究人员探讨了新产生的KZFP是否可能抑制这一循环。他们通过染色质免疫沉淀测序(ChIP-seq)分析了BL6J品系Chr4簇编码的50个KZFP(包括42个新分析的和8个已发表的)的DNA结合特性。结果发现,许多KZFP特异性地靶向不同的TE家族,例如,研究人员鉴定出靶向并沉默RLTR4_MM元件的特定KZFP,并发现了导致不同品系中IAPEz元件可变甲基化的KZFP修饰因子。有趣的是,一些被Chr4簇KZFP靶向的ERV,在Chr4簇本身仅表现出中等程度的富集,而非高度富集。这提示,能够结合并抑制这些ERV的新KZFP的出现,可能作为一种“刹车”,通过抑制ERV的逆转座活性来限制其进一步扩增,同时也减少了通过重组促进基因簇扩张的燃料。
本研究综合利用了多项关键技术方法:利用PacBio HiFi和牛津纳米孔(ONT)长读长测序技术对C57BL/6J、129S1/SvImJ小鼠品系及Mus spretus进行从头基因组组装,并结合已发表的T2T C57BL/6J、CAST/EiJ和Mus pahari基因组数据;通过结合PacBio Iso-Seq和RNA-seq数据进行转录组从头组装,手动注释和优化KZFP基因;使用多种生物信息学工具进行序列比对、系统发育分析、重复序列注释、片段重复分析和染色质免疫沉淀测序(ChIP-seq)数据分析。
De novo Mus musculus assemblies reveal a much larger KZFP gene cluster at the end of Chromosome 4
通过高质量的从头组装,本研究首次完整揭示了小鼠Chr4末端KZFP基因簇的真实规模,其大小远超参考基因组GRCm39中的注释,并在不同品系间存在显著差异,表明该区域是尚未被充分探索的遗传多样性储备库。
The Chr4 KZFP gene cluster has been independently expanding in different mouse strains and species
比较基因组学分析表明,Chr4 KZFP基因簇在小鼠不同品系和物种中经历了独立的扩张和分化,其KZFP指纹阵列库和序列排列高度异质,支持了该位点的平行进化。
The Chr4 KZFP gene cluster rapidly expanded by large segmental duplications encompassing multiple KZFP genes
对KZFP基因3‘外显子的序列相似性分析揭示,该基因簇的扩张主要归因于包含多个KZFP基因和其内部转座子的大片段重复事件,而非单个基因的独立复制。
Chromosomal position and meiotic recombination are not major drivers of KZFP gene cluster expansion and heterogeneity in mouse strains
对多个年轻和古老KZFP基因簇的分析表明,其重组倾向性和异质性并非由染色体端粒位置或减数分裂重组热点决定,年轻簇本身的高重复序列负荷可能是更关键的因素。
Young mouse KZFP gene clusters expanded together with the infiltration of new ERVs
转座子组成分析发现,小鼠年轻KZFP基因簇相较于大鼠同源区域,特异性地富集了小鼠谱系特有的ERV,且簇内ERV拷贝通过片段复制而非单纯逆转座实现富集,并发现非等位基因同源重组留下的痕迹。
Several KZFPs in the BL6J Chr4 cluster target ERVs moderately enriched within the Chr4 cluster itself
ChIP-seq分析绘制了Chr4簇KZFP的转座子靶标图谱,发现了一些品系特异的KZFP负责抑制特定ERV家族,且被靶向的ERV在基因簇内仅中度富集,提示KZFP可能通过抑制ERV活性来限制基因簇的进一步重组扩张。
综上所述,本研究通过克服基因组组装难题,揭示了年轻KZFP基因簇是基因组中高度动态和异质的区域。研究结果支持了一个模型,即ERV的整合通过促进非等位基因同源重组,驱动了KZFP基因簇的扩张和分化,同时ERV自身也通过片段复制这一新机制实现富集。新产生的KZFP则可能通过抑制其靶标ERV的活性,对这一自我强化的重组循环起到制动作用。这项工作不仅阐明了KZFP与ERV之间复杂的协同进化动力学,为理解宿主如何利用“以毒攻毒”策略管理基因组中的重复序列提供了新见解,而且强调了在群体水平系统分析KZFP基因簇多样性对于理解表型差异和基因调控网络进化的重要性。这种由转座子驱动的基因簇进化模式可能普遍存在于其他哺乳动物谱系中,预示着对基因组结构和功能进化更深入的认识。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号