被子植物着丝粒的进化创新与遗传多样性:从卫星DNA动态到物种形成的新见解
《Molecular Plant》:Evolutionary innovations and genetic diversity in angiosperm centromeres
【字体:
大
中
小
】
时间:2025年12月19日
来源:Molecular Plant 24.1
编辑推荐:
本研究针对着丝粒在序列快速更替与功能保守之间的"着丝粒悖论",通过对17种被子植物400多个完整着丝粒进行多组学分析,揭示了卫星重复序列和转座元件(TE)通过谱系特异性组合驱动着丝粒结构多样化的机制。研究发现TE插入密度与卫星同质性呈负相关,种群水平分析显示着丝粒卫星是进化变化的热点,跨物种比较揭示了着丝粒重复序列从渐进分化到完全更替的动态过程,为理解着丝粒驱动物种形成提供了新框架。
在基因组学领域,着丝粒一直是个令人着迷的谜题:这些染色体上负责细胞分裂时染色体正确分离的关键区域,其DNA序列在以百万年计的进化时间尺度上快速变化,但它们所承载的机械功能却高度保守。这种"着丝粒悖论"长期以来困扰着进化生物学家。传统上,由于着丝粒区域由长达数百万碱基的重复序列组成,包括卫星DNA阵列和散布的转座元件,使得常规基因组组装方法难以解析其完整结构。
随着端粒到端粒(T2T)测序技术的突破,科学家们终于能够揭开着丝粒生物学的神秘面纱。研究表明,着丝粒变异不仅是基因组 curiosities,更是驱动基因组创新和生殖隔离的关键因素,直接贡献于核型进化和物种形成。被子植物作为研究着丝粒进化的理想模型系统,其基因组大小和重复DNA含量表现出极大的变异,从转座元件贫乏的拟南芥(~21% TEs)到富含转座元件的物种如水稻(~45% TEs)和玉米(~85% TEs)。然而,着丝粒序列和结构在物种间的进化轨迹,以及在种群水平上是否存在共同或趋同的着丝粒动态模式,仍然知之甚少。
在这项发表于《Molecular Plant》的研究中,研究人员整合了超过400个来自17种二倍体被子植物的完整着丝粒数据,这些物种跨越约1.8亿年的进化分歧时间,代表了主要的被子植物谱系,包括ANA基部分类群、木兰类植物、单子叶植物和真双子叶植物。研究还结合了1000多个泛基因组数据集、重测序数据和同属全基因组序列,系统阐明了着丝粒序列和结构多样化的进化动力。
研究采用的主要技术方法包括:利用T2T基因组组装和CENH3染色质免疫沉淀测序(ChIP-seq)数据精确界定功能着丝粒区域;通过生物信息学流程统一识别和注释着丝粒卫星重复序列和转座元件;运用系统发育分析和主成分分析(PCA)追踪着丝粒序列的进化轨迹;通过种群基因组学方法评估着丝粒多态性;利用染色质分析技术研究CENH3核小体定位模式。
进化多样化着丝粒组成和结构在被子植物中的进化多样化
分析显示被子植物着丝粒大小呈现出惊人的可塑性,跨度达277倍(0.02-5.53 Mb)。尽管基因组大小和染色体长度与着丝粒大小呈轻微正相关,但这种关系在基于CENH3占据定义的着丝粒中更为显著(R2=0.50, P=0.0071)。着丝粒DNA组成分析揭示了物种间卫星DNA和TE含量的显著差异。在基部谱系和某些独立分支中未检测到特异性卫星重复,而拟南芥和谷子等物种的功能着丝粒主要由卫星重复主导。这些结果表明早期被子植物着丝粒可能并非主要由卫星重复组成,卫星可能在不同谱系中独立产生。
比较分析发现不同物种间完全不同的着丝粒卫星家族,反映了被子植物中快速且谱系特异性的进化。大多数卫星阵列保持100-200 bp的单体长度,与最优CENH3核小体结合一致。卫星拷贝数定量分析揭示了与着丝粒结构的明显关联:在倾向于简单着丝粒的物种中,卫星高度丰富且在染色体内部更均质;而在复杂着丝粒中,卫星较少且同源性更可变。高阶重复(HOR)组织在大多数物种中遵循负指数分布,通常源于单单体扩展。
研究鉴定了着丝粒和邻近着丝粒周围区域内的33,503个完整TEs,拷贝数在物种间差异很大。复杂着丝粒显示出较高比例的TE与CENH3关联,而TE含量较少的简单着丝粒仅显示有限的TE-CENH3关联。着丝粒特异性长末端重复(LTR)反转录转座子,特别是来自Gypsy超家族的,在大多数被子植物物种的着丝粒中占主导地位。年轻的TE插入在所有检查的物种中显著富集于着丝粒内,且插入的时间和频率在物种间明显不同,表明持续的TE驱动着丝粒更新。
利用多个同种T2T基因组组装的详细比较揭示了着丝粒大小和结构组织方面的广泛种内多态性。着丝粒结构变异主要源于由卫星和转座元件驱动的动态扩张和收缩循环。序列同一性分析显示,在所有检查的物种中,从着丝粒到着丝粒周围的序列同一性逐渐增加。出乎意料的是,卫星阵列通常比(着丝粒周围)区域内的非卫星序列(主要是TEs)更为分化。这种趋势在富含TE的着丝粒中最明显,其中卫星的分化超过了着丝粒周围区域。
对涵盖拟南芥属、稻属、短柄草属和玉蜀黍属所有当前公认68个分类群的284个公开基因组数据集的分析显示,着丝粒卫星重复在近期分化的同属物种间保持保守。随着分歧时间增加(~5-10 Mya),着丝粒卫星分化变得更加明显,序列多样化成与物种边界一致的系统发育 distinct 亚支。在高度分化的分类群(>10 Mya)中,着丝粒组成表现出彻底的重构。多倍体化为着丝粒进化增加了额外的复杂性,系统发育分析显示多倍体物种的着丝粒卫星重复与其二倍体祖先的重复交织在一起。
研究结论和讨论部分强调,着丝粒进化是由分子力量的复杂相互作用推动的,包括卫星DNA均质化、转座元件增殖和选择压力,这些力量共同保持核心动粒功能,同时促进快速序列更新。卫星重复和转座元件之间的相互作用在被子植物物种间表现出显著的可变性,深刻影响着着丝粒创新在种群中持续存在的程度。选择最终倾向于增强动粒性能和强度的创新,这是细胞分裂中自私着丝粒减数分裂驱动的关键决定因素。
对属内着丝粒卫星重复起源和进化轨迹的仔细检查揭示,着丝粒进化是高度动态的,在渐进分化阶段和突然重构事件之间振荡。结构变化如染色体重排可以通过降低杂种 fertility 和减数分裂兼容性作为生殖隔离,从而强化物种形成。尽管着丝粒重塑经常与谱系分化同时发生,但这种关联不一定意味着直接因果关系。然而,多个实验系统提供了令人信服的证据,表明着丝粒变异可以直接贡献于生殖隔离。
这项研究通过对被子植物着丝粒的大规模比较分析,揭示了着丝粒进化的动态过程和分子机制,为理解着丝粒在基因组进化和物种形成中的作用提供了重要见解。研究建立的统一分析框架和丰富的数据资源,将为未来着丝粒生物学研究提供重要基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号