非模式植物基因组组装:以毛茛科毛茛属为例揭示进化新见解

【字体: 时间:2025年09月22日 来源:The Plant Journal 5.7

编辑推荐:

  本综述系统评估了Illumina短读长、Oxford Nanopore(ONT)与PacBio(HiFi)长读长及混合测序策略在大型复杂基因组植物(毛茛属)中的应用。研究成功组装了二倍体 progenitor 物种 R. cassubicifolius 的质体基因组(156 kbp, 85基因)、线粒体基因组(1.18 Mbp, 40基因)及染色体级别核基因组(2.69 Gbp, 35,482注释基因),并首次呈现毛茛科质体与线粒体基因组系统发育图谱。研究揭示了基因丢失(infA、ycf15、rps等)的进化意义,为多倍化、无融合生殖及网状进化研究提供了关键基因组资源。

  

基因组测序与组装技术的进步为植物基因组学研究提供了强大工具,但对于基因组庞大且复杂的非模式植物而言,成本和技术挑战仍然存在。毛茛属(Ranunculus)作为毛茛科中物种丰富的属,在多倍化(polyploidy)、无融合生殖(apomixis)和网状进化(reticulate evolution)研究中具有重要地位。然而,该属此前缺乏高质量的线粒体和核基因组参考序列,限制了其进化生物学和功能基因组学研究的深度。

研究团队以二倍体物种 R. cassubicifolius(R. auricomus 复合体)为材料,系统比较了Illumina短读长、Oxford Nanopore Technology(ONT)和PacBio HiFi长读长以及混合测序策略的组装效果。通过完整性、连续性和质量指标的综合评估,最终选择了基于PacBio HiFi数据的组装方案,并辅以三次抛光(使用过滤后的短读长数据)和染色质构象捕获(Hi-C)技术,成功将基因组scaffolding至8条假染色体。

质体基因组组装结果展示了一个典型的四部分结构,总长156,233 bp,包含85个蛋白编码基因、37个tRNA和8个rRNA,编码含量达53.2%。与近缘物种比较显示,基因数量和结构高度保守,但在非编码区存在插入/缺失变异。线粒体基因组组装长度为1.18 Mbp,包含40个蛋白编码基因、77个tRNA和7个rRNA,编码含量为7.99%。值得注意的是,线粒体基因组在毛茛科内表现出显著的大小变异和结构重组。

基于308个质体基因组序列的系统发育分析构建了毛茛科的高支持度进化树,揭示了 Ranunculus 属内三大主要分支的形成。基因进化分析发现,infA、ycf15 和 rps 等基因在毛茛科多个谱系中频繁丢失。特别值得注意的是,在 R. cassubicifolius 中,infA 基因已从质体基因组丢失并转移至核基因组,这一发现为理解基因转移的进化意义提供了新证据。

核基因组组装最终获得2.69 Gbp的单倍体基因组序列,contig N50达到20 Mbp,scaffold N50为355 Mbp。通过BUSCO评估显示94.1%的保守基因被完整保留,其中78.8%为单拷贝基因。基因组注释预测了35,482个蛋白编码基因,其中31,322个为独特基因。重复序列分析揭示基因组中86%为重复元件,主要以长末端重复反转录转座子(LTR-RT)为主,其中Gypsy类型占24.3%,Copia类型占3.0%。

比较基因组学分析发现了两次古老的基因复制事件:一次发生在53.1 mya,可能与毛茛科基部辐射相关;另一次发生在1.88 mya,可能与 R. auricomus 物种复合体的形成相关。这些发现为了解毛茛属基因组进化历史提供了重要线索。

在组装策略比较方面,研究显示短读长组装(Supernova和SPAdes)在基因组完整性和连续性方面表现较差,而长读长策略(特别是PacBio HiFi结合Hifiasm组装)能够显著提高组装质量。抛光步骤虽然对高质量组装的改进有限,但对于低质量组装能够有效减少错误和重复。

这项研究不仅提供了毛茛属首个染色体级别的高质量参考基因组,还建立了毛茛科器官基因组进化的新框架。这些基因组资源将为未来研究多倍化进化、无融合生殖机制、核质互作以及环境适应性进化提供重要基础。特别值得注意的是,研究中发现的一些基因丢失和转移事件可能与该属植物适应不同生态环境和生殖策略密切相关。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号