
-
生物通官微
陪你抓住生命科技
跳动的脉搏
杨树和柳树近完整基因组揭示着丝粒动态演化与物种多样化的表观遗传机制
【字体: 大 中 小 】 时间:2025年05月03日 来源:Genome Biology 10.1
编辑推荐:
本研究通过PacBio HiFi长读长测序技术,完成了杨柳科4个物种(2种杨属和2种柳属)近完整单倍型基因组组装,首次系统解析了杨柳科着丝粒的遗传与表观景观。研究发现杨柳科着丝粒主要由转座元件(TE)而非串联重复序列(TRA)构成,其中CRM和ATHILA等逆转录转座子广泛入侵,杨属还特有LINE元件富集。比较基因组学揭示了着丝粒通过卫星序列均质化和TE扩张驱动的快速演化模式,以及着丝粒重定位对染色体结构和基因表达的调控作用。该成果为理解植物着丝粒进化与物种分化提供了新范式,发表于《Genome Biology》。
在生命演化的宏大叙事中,着丝粒(centromere)如同染色体上的神秘指挥家,精准调控细胞分裂时染色体的分离舞蹈。然而这个关键区域却因富含重复序列而长期被视为基因组中的"暗物质"。传统观点认为着丝粒主要由串联重复的卫星DNA构成,但近年研究发现马铃薯等植物存在无卫星着丝粒,暗示着丝粒组成的多样性远超预期。杨柳科植物作为北半球重要的生态和经济树种,其基因组在"杨柳科全基因组复制事件"后保持稳定核型(2n=38),但着丝粒的演化机制始终成谜。
四川大学联合电子科技大学等机构的研究团队在《Genome Biology》发表突破性研究,通过PacBio HiFi测序(>60×覆盖度)结合Hi-C技术(>600×),完成了白杨(Populus alba var. pyramidalis)、胡杨(P. euphratica)等4个杨柳科物种的单倍型分相基因组组装(contig N50达9.75-21.42 Mb)。研究采用CUT&Tag技术绘制CENH3(着丝粒特异性组蛋白变体)结合图谱,结合全基因组甲基化测序(WGBS)和RNA-seq等多组学分析,首次系统揭示了杨柳科着丝粒的动态演化规律。
关键方法
研究选取杨柳科4物种新鲜叶片提取DNA,通过PacBio Sequel II平台生成HiFi reads,使用hifiasm进行单倍型分相组装,Juicer和3D-DNA进行Hi-C染色体挂载。利用TRASH鉴定串联重复序列,EDTA注释转座元件。通过兔源多克隆抗体(靶向CENH3-1/CENH3-2)进行CUT&Tag测序定位功能性着丝粒,MACS2界定核心着丝粒区域(0.02-1.37 Mb)。整合H3K4me3/H3K27me3等组蛋白修饰数据和WGBS分析表观特征。
Telomere-to-telomere haplotype-resolved genome assembly
研究获得8个高质量单倍型基因组,大小295.91-497.16 Mb,锚定至19条假染色体。发现柳属特有CENH3-2基因在杨属中假基因化,免疫荧光证实CENH3-1是杨属主要着丝粒标记蛋白。着丝粒区域呈现高GC含量(47.6%)、低基因密度(<0.5个/Mb)和高TE密度(86.1%)特征,DNA甲基化水平(CG背景达82.3%)显著高于侧翼区域。
Centromeric TRAs are limited and highly diverse
仅少数染色体(5-14条)着丝粒含有TRA,如白杨chr01的Palv156重复单元(156 bp)形成高阶重复(HOR),单染色体内部相似性(91.2%)显著高于染色体间(64.5%)。胡杨着丝粒TRA占比仅3.7%,而柳属Sar145等卫星序列与杨属Palv148同源但独立演化,揭示物种特异性扩张模式。
Abundant non-centromeric TRAs
基因组中占比71-93%的TRA位于非着丝粒区,如柳属Salix180(180 bp单体)在染色体长臂形成 megabase级阵列。这些区域虽无CENH3结合但呈现着丝粒样表观特征(H3K27me3降低60%,CHG甲基化升高2.1倍),Hi-C互作分析显示其与着丝粒存在物理互作。
Transposable elements dominate centromeres
CRM逆转录转座子在所有物种着丝粒富集(9.36-23.78%),系统发育分析显示其分化为着丝粒特异性分支(分化时间:柳属5.07 Mya vs 杨属1.94 Mya)。胡杨着丝粒区ATHILA元件近期爆发式扩张(11.23 kb/元件),导致基因组增大90 Mb。杨属特有LINE元件(L1-1_PTr)在着丝粒特异性扩增,CENH3结合信号较非着丝粒TE高3.8倍。
Frequent centromere repositioning
比较基因组发现8对同源染色体存在着丝粒重定位,如柳属chr10着丝粒位于中部(臂比1.1),而杨属偏于一侧(臂比5.4)。重定位区域基因表达降低4.2倍,CG甲基化升高37.5%,拓扑关联域(TAD)长度缩短42.6%,表明着丝粒移动通过表观重编程影响基因组三维结构。
这项研究颠覆了着丝粒主要由卫星DNA组成的传统认知,揭示杨柳科通过"TE入侵-卫星均质化-着丝粒重定位"的动态演化模式。特别值得注意的是,杨属和柳属分化后(约22 Mya),LINE元件仅在杨属着丝粒特异性扩张,而柳属通过CENH3-2基因功能分化可能适应不同选择压力。胡杨着丝粒区ATHILA的爆发式扩张与其耐盐适应性是否相关,为后续研究提供新方向。该成果为理解植物着丝粒的可塑性进化及其在物种形成中的作用提供了范式转移,也为利用表观调控改良林木品种奠定理论基础。
生物通微信公众号
知名企业招聘