染色体水平基因组解析揭示Elaeocarpus petiolatus的环境适应与药用成分合成机制

【字体: 时间:2025年07月17日 来源:Scientific Data 5.8

编辑推荐:

  研究人员针对热带重要树种Elaeocarpus petiolatus基因组资源匮乏的问题,采用PacBio HiFi和Hi-C技术完成首个杜英科染色体级别基因组组装(322.45 Mb,N50 20.58 Mb),注释25,295个功能基因(96.74%已注释)和37.11%重复序列,为解析其环境适应性及活性成分合成机制提供关键资源。该成果发表于《Scientific Data》,数据已公开(PRJNA1173526)。

  

杜英科植物作为热带-亚热带森林生态系统的关键组分,不仅维持着生物多样性,还提供重要的木材、观赏和药用资源。其中Elaeocarpus petiolatus(柄果杜英)因其坚硬木材和叶片提取物的抗炎、抗氧化特性备受关注,但基因组信息的缺失严重阻碍了其遗传机制研究。尽管国际自然保护联盟(IUCN)将其列为无危物种,栖息地破坏的威胁仍需要从分子层面解析其适应策略。更令人遗憾的是,整个杜英科家族此前仅有两个高度碎片化的基因组数据(contig N50≤2.6 kb),严重制约了比较基因组学研究。

针对这一空白,中国科学院西双版纳热带植物园园艺中心的研究团队在《Scientific Data》发表了首个染色体级别的柄果杜英基因组。通过PacBio HiFi长读长测序(37.86×覆盖度)结合Hi-C技术(143.09×),构建了包含15条假染色体的高质量参考基因组(BUSCO完整性99.07%)。研究采用改良CTAB法从4年生植株叶片提取DNA,利用hifiasm组装后通过Hi-C数据锚定,最终获得 scaffold N50达20.58 Mb的连续基因组。重复序列分析显示LTR反转录转座子占比8.27%,而21.79%为未分类重复序列,暗示该物种可能存在独特的基因组进化特征。

基因组特征
k-mer分析预估基因组大小325.52 Mb(杂合度1.68%),实际组装322.45 Mb包含25,295个蛋白编码基因,平均每个基因含5.64个外显子。值得注意的是,7条假染色体实现无间隙组装,15条染色体共锚定98.73%的基因组序列。

重复元件与基因功能
重复序列占基因组的37.11%,其中LTR retrotransposons(长末端重复反转录转座子)占比最高(8.27%)。功能注释发现1,431个转录因子,MYB、bHLH等家族最为富集。与5种蔷薇亚纲物种的比较显示,17,560个基因(69.42%)在SwissProt数据库获得功能注释。

技术验证
RNA-seq数据比对率96.11%,LTR组装指数(LAI)达18.56,表明基因组具有高度完整性。与现有杜英科基因组相比,该组装连续性提升近8,000倍(contig N50 19.59 Mb vs 2.6 kb)。

这项研究建立的基因组资源为阐明柄果杜英的环境适应机制和药用成分合成通路奠定了基础。特别值得注意的是,21.76%的未分类重复序列可能蕴含物种特异性进化线索,而8.27%的LTR密度反映了转座子在基因组塑造中的重要作用。研究人员公开了所有原始数据(SRR31035705等),将促进杜英科植物的比较基因组学研究。该成果不仅对热带森林资源保护具有实践意义,其采用的HiFi+Hi-C策略也为其他非模式植物基因组研究提供了技术范本。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号