首个阿拉比卡咖啡(Mundo Novo)近端粒到端粒基因组揭示其独特风味与甜菊糖苷M生物合成的关键机制

【字体: 时间:2025年09月28日 来源:Molecular Ecology Resources 5.5

编辑推荐:

  本研究首次报道了阿拉比卡咖啡(Coffea arabica)栽培种Mundo Novo的近端粒到端粒(T2T)基因组,通过整合PacBio HiFi、ONT ultra-long和Hi-C测序技术,构建了迄今最完整的四倍体咖啡基因组。研究揭示了咖啡因生物合成相关N-甲基转移酶(NMTs)在咖啡、茶和可可中的独立进化历程,并通过基因家族扩张分析和转录组学发现糖基转移酶(UGTs)在阿拉比卡次级代谢中的核心作用。尤为重要的是,研究发现UGT29亚家族中的一个成员(CaUGT)能够直接催化甜菊糖苷A(Reb A)转化为高价值甜味剂甜菊糖苷M(Reb M),为风味改良和甜菊糖苷的生物制造提供了全新策略。

  
基因组组装与注释
研究团队采用多种前沿测序技术对阿拉比卡咖啡栽培种Mundo Novo进行全基因组测序。通过k-mer分析(k=21)预估基因组大小为1.16 Gb,杂合率为4.52%。整合49.30 Gb的ONT超长读长和90.25 Gb的PacBio HiFi读长数据,初步组装获得1.23 Gb的基因组草图。利用130 Gb的Hi-C数据,最终将1.19 Gb的contig锚定到22条伪染色体上(2n=4x=44),挂载率高达96.75%,contig N50达到47.37 Mb。
基因组质量评估显示:NGS读长和HiFi读长的基因组比对率分别为99.41%和99.65%;BUSCO分析基于embryophyta_odb10数据库显示98.70%的完整度;Merqury分析获得48.95的共识质量值(QV),远超地球生物基因组计划(EBP)的标准。Hi-C热图显示出强烈的染色体内相互作用信号,证实了组装的高度准确性。
基因组注释揭示:重复序列占基因组的68.08%,其中LTR反转座子(Copia元件35.88%,Gypsy元件8.32%)占主导地位。共注释到71,345个蛋白质编码基因,其中88.43%获得功能注释。通过主成分分析(PCA)将22条染色体清晰区分为C和E两个亚基因组,分别对应于C. canephora和C. eugenioides祖先。
比较基因组学与进化分析
通过对15个物种(包括12个菊类植物、2个蔷薇类植物和1个基部双子叶植物)的比较基因组学分析,鉴定出412个单拷贝直系同源基因。系统发育树显示阿拉比卡的两个亚基因组分别与C. canephora和C. eugenioides聚为一支,证实了其异源四倍体起源。分化时间估算表明咖啡属物种在约3700万年前从茜草科亚共同祖先中分化出来。
结构变异(SV)分析发现,与Mundo Novo基因组相比,Bourbon和ET-39品种分别存在157和440个SVs,包括倒位(INV)、易位(TRA)、缺失(DEL)和重复(DUP)等多种类型,这些变异为咖啡育种提供了宝贵的遗传资源。
咖啡因生物合成NMTs的独立进化
研究重点关注了咖啡因生物合成中的关键酶——N-甲基转移酶(NMTs)的进化历程。通过从UniProt数据库获取所有已审核和未审核的NMT基因,构建了包括茶、可可和四种咖啡物种(罗布斯塔咖啡、C. eugenioides、C. humblotiana和阿拉比卡咖啡)在内的系统发育树。
结果显示:可可的NMTs最先分化,形成独立于茶和咖啡的姐妹谱系;四个咖啡物种的NMTs聚集在一起,其中阿拉比卡的两个亚基因组分别与其祖先物种聚类的;茶和咖啡的NMTs各自形成单系群。这些发现证实了咖啡因生物合成相关NMTs在咖啡、茶和可可这三个含咖啡因类群中经历了三次独立进化事件。
糖基转移酶在次级代谢中的关键作用
为探究阿拉比卡独特风味的分子基础,研究团队对扩张基因家族进行了GO富集分析。结果显示糖基转移酶和糖苷生物合成相关功能显著富集,表明糖基转移酶可能在咖啡次级代谢中扮演关键角色。CNet分析进一步显示,大量扩张基因具有葡萄糖醛酸转移酶活性。
转录组分析来自不同组织(嫩茎、木质茎、幼叶、成熟叶、根和果实)的数据显示,31.56%的差异表达基因在果实中特异性上调。KEGG富集分析发现这些基因显著富集于氨基糖和核苷酸糖代谢(ko00520)、淀粉和蔗糖代谢(ko00500)以及糖酵解/糖异生(ko00010)等通路,这些代谢过程可能通过糖基化修饰影响风味物质的形成。
UGT29亚家族的功能特征与机制解析
研究团队对15个植物物种的UGT基因进行了全面鉴定,发现阿拉比卡、C. canephora和C. eugenioides的UGT基因数量分别为209、135和150个。特别值得注意的是,阿拉比卡亚基因组C的UGT29家族基因拷贝数显著增加,该家族包含25个UGT基因。
功能实验表明,来自UGT29家族的一个UGT基因(CaraCg5507.t1,命名为CaUGT)能够直接催化甜菊糖苷A(Reb A)转化为甜菊糖苷M(Reb M)。这是首次发现单个UGT能够直接完成这一转化过程,而不需要多个UGT的协同作用。
酶学性质研究表明:CaUGT的最适反应温度为37°C,最适pH为8.0;是一种金属依赖性酶,Mg2+增强其活性,Cu2+强烈抑制;在最优条件下反应2小时,Reb M的产率可达91.65%,显示出巨大的应用潜力。
通过分子对接和动力学模拟,研究人员揭示了CaUGT的催化机制:该酶具有典型的GT-B折叠结构,N端域含有柔性的环状结构,提供更大的底物结合口袋;C端域包含42个氨基酸的保守PSPG-box序列。关键残基H19负责去质子化糖受体,D118稳定质子转移。特别重要的是,残基K203通过与底物4位氧形成氢键,固定糖环构象, enabling β-1,2糖苷键形成;而残基L120和L362通过疏水相互作用稳定底物构象, enabling β-1,3糖苷键形成。这种独特的结构特征使CaUGT能够催化两种不同类型的糖苷键形成。
系统发育分析显示UGT29和UGT94亚家族共同聚集在同一基因簇(cluster267)中,与拟南芥UGT76作为外群构建的系统树表明UGT29可能起源于UGT94亚家族,这为了解阿拉伯卡独特风味的分子基础提供了新的进化视角。
讨论与展望
本研究提供的阿拉比卡咖啡近T2T基因组组装为咖啡遗传改良和可持续生产提供了宝贵的基因组资源。对咖啡因生物合成NMTs进化历史的澄清增进了我们对植物次级代谢进化机制的理解。特别是发现CaUGT能够直接催化Reb A向Reb M的转化,为高价值甜味剂的生物制造提供了新的技术路线,同时也为阐释阿拉比卡咖啡独特风味的形成机制提供了重要线索。
UGT基因簇在阿拉比卡中的扩张和功能分化可能成为分子育种的重要靶点,为咖啡品种品质改良提供新的方向。这些发现不仅推进了咖啡生物学的基础理解,也为合成生物学应用奠定了坚实基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号