揭秘香蕉物种形成的基因组驱动因素:野生香蕉祖先基因组组装带来的新突破

【字体: 时间:2025年01月23日 来源:Nature Communications

编辑推荐:

  香蕉栽培品种基因组复杂,其起源涉及多个野生遗传群体,包括两个未知祖先。研究人员通过对野生香蕉祖先进行基因组组装,明确了未知祖先,揭示了物种形成过程及染色体演化机制。这为香蕉遗传研究和品种改良提供关键资源,意义重大。

  香蕉,这种在全球热带和亚热带地区广泛种植的水果,不仅是人们餐桌上的常客,更是许多地区的重要主食。然而,长期的单一栽培使得香蕉面临着严峻的生物胁迫挑战。比如,尖孢镰刀菌热带 4 号小种(Fusarium TR4)正肆意蔓延,无情地摧毁着大片香蕉种植园;黑叶斑病同样来势汹汹,为了对抗它,种植者不得不大量使用农药,这不仅增加了生产成本,还对环境造成了严重破坏。
造成香蕉如此脆弱的原因之一,是其栽培品种基因组的高度复杂性。这些基因组宛如复杂的拼图,由多个野生遗传群体的基因片段拼凑而成,其中还包含两个身份神秘的未知祖先基因。在过去,由于对香蕉品种基因组架构以及农艺性状遗传机制的了解极为有限,再加上品种本身的不育或低育性,使得培育抗病香蕉品种的工作困难重重,就像在黑暗中摸索前行,找不到方向。

为了打破这一困境,来自法国农业国际合作研究中心(CIRAD)、蒙彼利埃大学(Univ Montpellier)等多个机构的研究人员携手展开了一项极具意义的研究。他们深入挖掘香蕉物种形成的基因组驱动因素,通过对野生香蕉祖先进行基因组组装,试图揭开香蕉复杂基因组的神秘面纱。

研究人员取得了一系列令人瞩目的成果。在《Nature Communications》发表的论文中,他们详细阐述了研究发现。通过对五个野生香蕉品种和一个涉及两个未知祖先的栽培品种进行染色体水平的基因组组装,研究人员确认了其中一个未知祖先为小果野蕉(M. acuminata ssp. halabanensis),另一个未知祖先则与长梗蕉(M. a. ssp. zebrina)密切相关。这一发现就像是在黑暗中点亮了一盏明灯,为后续研究指明了方向。

系统发育分析进一步揭示了香蕉物种的演化历程。大约在 440 万年前,所有小果野蕉(M. acuminata)亚种、蕉麻(M. schizocarpa)和未知祖先从大蕉(M. balbisiana)中分化出来,形成了一个单系群。在这个单系群里,又可以清晰地划分出三个不同的亚群,这为香蕉的分类和进化研究提供了重要线索。

研究还发现,香蕉基因组存在大量染色体重排现象,包括相互易位和倒位。这些重排就像是基因组的 “大洗牌”,在物种形成过程中发挥了关键作用。例如,在小果野蕉(M. acuminata)的不同亚种中,研究人员发现了多种染色体重排事件,这些事件改变了染色体的结构和基因排列,进而影响了物种的进化。

着丝粒区域的分化也是研究的一大亮点。研究人员发现,不同香蕉物种的着丝粒区域存在丰富多样的重复序列,包括反转录转座子、LINE 元件和核糖体 DNA(rDNA)等。这些重复序列的差异可能导致了染色体在减数分裂过程中的行为变化,从而促进了物种的分化。

此外,研究人员还对卡文迪什香蕉(Cavendish)的基因组进行了深入分析。他们发现,现有的卡文迪什香蕉(Cavendish)基因组组装存在一些问题,如部分染色体重排未被正确识别,同源单倍型出现错误合并等。而本次研究中获得的野生祖先基因组组装结果,将为改进卡文迪什香蕉(Cavendish)的基因组组装提供有力的指导,就像为拼图找到了缺失的关键碎片。

在研究过程中,研究人员运用了多种关键技术方法。首先是基因组测序技术,他们综合利用了 Illumina 短读长测序技术和牛津纳米孔(ONT)长读长测序技术,为基因组组装提供了丰富的数据基础。对于一些样本,还采用了太平洋生物科学公司(Pacific Biosciences)的 HiFi 测序技术,以获取更高质量的序列信息。其次是生物信息学分析方法,通过多种软件对测序数据进行组装、注释和分析,包括使用 Necat、Flye 等软件进行基因组组装,利用 liftoff 进行基因注释转移,运用 jcvi 工具寻找直系同源基因和共线性区块等。此外,研究人员还借助了分子细胞遗传学技术,如染色体原位杂交技术,直观地观察染色体的结构和基因定位。

研究结果方面:

  • 基因组组装概述:研究人员成功组装了四个野生香蕉品种(代表三个小果野蕉(M. acuminata)亚种和蕉麻(M. textilis))以及改进了蕉麻(M. schizocarpa)的基因组。这些基因组组装达到了染色体水平,质量较高,平均有 96.6% 的序列锚定在染色体上,Busco 完整性在 95.8% - 98.9% 之间,每个组装体中预测出约 35,000 个基因模型。
  • Pisang Madu 栽培品种组装揭示未知祖先基因组:对 Pisang Madu 栽培品种的基因组分析表明,其一个单倍型(Pisang Madu H1)来源于小果野蕉(M. a. ssp. halabanensis),另一个单倍型(H2)则是由多个祖先组成的镶嵌体,其中未知祖先的区域占比至少 30%。
  • 揭示未知祖先的系统发育位置:通过对 Pisang Madu H2 中未知祖先区域的 10,635 个直系同源基因进行系统发育分析,研究人员确定了未知祖先与长梗蕉(M. a. ssp. zebrina)关系密切,同时也明确了各物种之间的分化时间。
  • 追溯相互易位的出现并完善其结构:通过全基因组比较,研究人员发现了香蕉基因组中存在的多种染色体重排现象,并对其结构进行了精确解析。例如,明确了小果野蕉(M. a. ssp. malaccensis)中 chr1/chr4、长梗蕉(M. a. ssp. zebrina)中 chr3/chr8 以及 Pisang Madu H2 中 chr1/chr7 重排的具体结构和形成过程。
  • 重复序列分布揭示香蕉着丝粒区域的变异:分析香蕉和芭蕉属(Ensete)基因组的重复序列发现,不同物种基因组中重复序列的比例在 53% - 62% 之间。着丝粒和近着丝粒区域存在多种特征性的重复序列,如 Copia LTR 反转录转座子、Nanica LINE 元件和 rDNA 等,这些重复序列在不同物种中的分布和组成存在差异。
  • 祖先对当前卡文迪什香蕉组装的结构洞察:对卡文迪什香蕉(Cavendish)基因组的分析发现,现有组装存在一些问题,如祖先贡献比例的不准确估计、染色体重排的错误识别等。研究人员通过原位染色体绘画和 BAC - FISH 分析,验证了卡文迪什香蕉(Cavendish)基因组中存在的染色体重排,并表明野生祖先基因组组装有助于改进卡文迪什香蕉(Cavendish)的基因组组装。

研究结论和讨论部分,本次研究成果意义非凡。这些基因组组装为香蕉遗传学研究提供了关键资源,有助于深入了解香蕉品种的起源和演化。同时,准确的基因组组装和对祖先基因组架构的了解,对于制定合理的育种策略至关重要。通过这些研究,研究人员可以精准定位有利基因和等位基因,为培育抗病、优质的香蕉品种奠定坚实基础。此外,研究中发现的染色体重排和着丝粒分化等基因组驱动因素,为研究物种形成机制提供了重要的参考,让我们对生物进化过程有了更深入的认识。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号