从基因组到基因表达:尾叶桉与巨桉杂交种(Eucalyptus urograndis)的基因组图谱及其与亲本物种的进化分歧

《BMC Plant Biology》:From genome to gene expression: the genomic landscape of a hybrid species of Eucalyptus urophylla × Eucalyptus grandis and its divergence from parental species hybrid

【字体: 时间:2025年10月28日 来源:BMC Plant Biology 4.8

编辑推荐:

  本研究针对桉树杂交种Eucalyptus urograndis(尾叶桉×巨桉)的基因组资源匮乏问题,通过整合PacBio长读长测序和Hi-C技术,构建了染色体级别的基因组草图(592.09 Mb,contig N50 3.73 Mb),注释出32,151个基因。研究发现该杂交种与亲本巨桉约在2.90 Mya前分化,并识别出131个显著扩张的基因家族和475个正选择基因(PSGs)。通过RNA-seq分析木质素、纤维素和木聚糖生物合成关键酶的等位基因特异性表达(ASE),揭示了其与杂种优势相关的非加性表达模式,为桉树分子育种和杂种优势机制解析提供了重要基因组资源。

  
桉树是全球重要的速生用材树种,广泛用于纤维、能源和造纸工业。其中,尾叶桉与巨桉的杂交种Eucalyptus urograndis(简称E. urograndis)因其生长快、产量高、木材品质优良而成为人工林主栽品种,展现出明显的杂种优势。然而,其基因组资源匮乏,限制了从分子层面解析其优良性状形成机制及杂交优势的遗传基础。此前虽有杂交种基因组报道,但针对特定优良无性系(如DH32-29)并结合亲本基因表达模式系统分析木质形成相关通路的研究仍较为缺乏。为此,Liu等人于《BMC Plant Biology》发表了题为“From genome to gene expression: the genomic landscape of a hybrid species of Eucalyptus urophylla × Eucalyptus grandis and its divergence from parental species”的研究论文,旨在通过构建高质量基因组图谱,揭示其进化历程及木材成分相关基因的表达调控特征。
研究团队综合利用BGI-SEQ500、PacBio单分子实时(SMRT)长读长测序和Hi-C(高通量染色体构象捕获)技术,对E. urograndis无性系DH32-29进行全基因组测序与组装,并采集叶片、木质部和形成层进行RNA测序(RNA-seq)以辅助基因注释。通过K-mer分析估计基因组大小(566.72 Mb)和杂合度(2.71%)。利用OrthoMCL进行基因家族聚类,采用BUSCO评估组装和注释完整性。通过MCScanX和Ks(同义替换率)分析共线性与全基因组复制(WGD)事件,利用PAML的CodeML进行正选择基因(PSGs)筛选。对亲本及杂交种木质部组织进行RNA-seq,采用DESeq2鉴定纤维素、木聚糖和木质素生物合成通路中的差异表达基因(DEGs),并分析其等位基因表达模式。
基因组调查与染色体级别组装
K-mer分析显示E. urograndis基因组杂合度高,重复序列占比59.00%。PacBio组装获得总长591.88 Mb的草图,contig N50达3.73 Mb。Hi-C辅助组装将99.91%序列锚定至11条假染色体,scaffold N50提升至58.62 Mb。BUSCO评估显示组装完整性达94.90%,基因注释完整性为93.50%。
基因组注释与功能分析
重复序列占基因组47.48%,以LTR(长末端重复)为主(34.68%)。预测出32,151个蛋白编码基因,平均含4.99个外显子。非编码RNA中miRNA数量最多(994个),rRNA总长度最长。功能注释显示96.48%的基因被成功注释,KEGG富集于代谢、次生代谢物合成等通路,GO分类显示基因广泛参与代谢过程、膜组成及催化活性。
基因家族进化与系统发育分析
与12种植物比较显示E. urograndis有142个特有基因家族。系统发育树确认其与E. grandis、E. melliodora亲缘最近,分化时间约2.90 Mya(上新世末期)。基因家族扩张/收缩分析发现131个显著扩张家族(如CAD、SUSY相关基因),可能参与木质素合成和碳分配。
共线性与全基因组复制(WGD)事件
E. urograndis与E. grandis基因组共线性高(59.60%同源基因对),但存在染色体融合和重排。Ks分析检测到古代WGD事件(γ事件,约127.79 Mya)和近期小规模复制,分化速率估计为4.75×10?9 位点/年。
等位基因特异性表达与木材成分合成通路
RNA-seq分析揭示纤维素合成通路中50个DEGs,多数呈超显性(25个)或高亲优势(6个),SUSY(蔗糖合酶)和INV(β-果糖苷酶)基因在杂交种中表达显著上调。木聚糖合成中44个DEGs以超显性为主(24个)。木质素通路中DEGs多表现为低亲优势(16个)或亚显性(17个),CAD(肉桂醇脱氢酶)和CCR(肉桂酰CoA还原酶)各有一个基因在杂交种中沉默(亲本共沉默模式),可能与E. urograndis木质素含量较低相关。
本研究成功构建了E. urograndis的高质量染色体级别基因组,揭示其与亲本的分化时间、基因家族扩张及正选择信号。通过整合转录组数据,发现木材成分合成通路中关键基因的等位基因特异性表达(ASE)模式与非加性效应,为杂种优势的分子机制提供了新见解。该基因组资源不仅助力桉树分子育种,也为木本植物杂交进化研究提供了重要参考。未来可通过基因编辑靶向调控木质素合成基因,培育更适于制浆造纸的优良品种。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号