蓝桉染色体水平高质量基因组组装揭示桉叶油积累的分子动力学机制

【字体: 时间:2025年07月02日 来源:Scientific Data 5.8

编辑推荐:

  本研究针对桉叶油主要来源植物蓝桉(Eucalyptus globulus Labill.)基因组信息缺失的问题,通过整合PacBio HiFi长读长、Illumina短读长和Hi-C数据,成功构建了556.98 Mb的染色体水平基因组(scaffold N50达54.03 Mb),锚定率99.05%至11条染色体,预测36,387个功能注释基因(96.8%完成注释)。该研究为解析单萜类化合物1,8-桉叶素(cineole)生物合成的MEP/MVA通路关键基因(如CinS、DXR、FPS)提供了核心资源,对桉树分子育种和次生代谢研究具有里程碑意义。

  

研究背景与科学问题
蓝桉作为桉叶油的主要工业来源,其叶片中富含的1,8-桉叶素(1,8-cineole)具有抗菌、抗氧化等药理活性,全球年产值超10亿美元。然而,桉叶油高效合成的分子机制长期不明,核心限制因素是缺乏高质量的基因组参考。尽管已有6种桉树基因组发布,但作为桉叶油含量最高的蓝桉,其基因组碎片化严重(此前contig N50仅0.64 Mb),且关键萜类合成通路基因(如cineole synthase)尚未系统鉴定。

研究设计与技术路线
西南林业大学联合团队采用多组学策略:

  1. 测序技术:PacBio Sequel II HiFi(39×覆盖度,读长N50 16.93 kb)、Illumina NovaSeq X Plus(63×)、Hi-C(99.13 Gb)和Oxford Nanopore转录组(12.59 Gb)
  2. 组装方法:Hifiasm+3D-DNA染色体挂载,Juicerbox手动校正
  3. 基因注释:整合de novo(Augustus)、同源(GeMoMa)和转录组(TransDecoder)预测

主要研究发现
基因组特征
组装获得556.98 Mb基因组(较前版提升11.96 Mb),contig N50达37.93 Mb,BUSCO完整性98.3%。Hi-C热图显示11条染色体清晰互作模式,其中6条实现端粒到端粒(T2T)组装。

重复序列与基因资源
LTR反转座子占比最高(25.61%),预测36,387个蛋白编码基因(平均5.06个外显子/基因),96.8%完成功能注释。比较基因组分析显示蓝桉与近缘种(Corymbia citriodora等)基因结构高度保守。

桉叶油合成通路
鉴定到MEP(甲基赤藓糖醇磷酸)和MVA(甲羟戊酸)通路关键酶基因:

  • 限速酶:1-脱氧-D-木酮糖-5-磷酸还原异构酶(DXR)
  • 直接催化基因:桉叶素合成酶(CinS)
  • 底物供应基因:法尼基焦磷酸合成酶(FPS)、牻牛儿基焦磷酸合成酶(GGPPS)

研究意义
该基因组为解析桉叶油合成的分子动力学提供了三大工具:

  1. 染色体尺度参考:支持eQTL(表达数量性状位点)分析和单倍型挖掘
  2. 候选基因库:加速CinS等关键酶基因的CRISPR编辑育种
  3. 进化标记:揭示Myrtaceae(桃金娘科)萜类合成通路的保守性与分化

这项发表于《Scientific Data》的研究,首次实现蓝桉基因组从"碎片化"到"染色体完美组装"的跨越,为高附加值植物精油作物的精准设计育种树立了新标准。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号