
-
生物通官微
陪你抓住生命科技
跳动的脉搏
四倍体雷竹'Prevernalis'染色体水平基因组组装与注释揭示其高营养价值分子基础
【字体: 大 中 小 】 时间:2025年05月31日 来源:Scientific Data 5.8
编辑推荐:
本研究针对高营养价值雷竹(Phyllostachys violascens 'Prevernalis')缺乏高质量参考基因组的难题,通过PacBio HiFi长读长测序与Hi-C技术相结合,成功构建了首个染色体水平的四倍体雷竹基因组(2,156.14 Mb,N50 56.48 Mb)。该研究鉴定出53,558个蛋白编码基因(94.13%功能注释)和68.45%重复序列,发现487个显著扩张基因家族与代谢调控相关,为解析竹笋营养品质形成机制提供了关键基因组资源。
在江南地区被誉为"江南第一笋"的雷竹(Phyllostachys violascens 'Prevernalis'),因其早春打雷时萌笋的特性得名,其竹笋富含必需氨基酸、酚类和植物甾醇等活性物质,具有预防肥胖、糖尿病和高血压等疾病的潜力。然而,由于该物种为四倍体(2n=4x=48)且基因组庞大,此前一直缺乏高质量参考基因组,严重阻碍了对其优异农艺性状分子机制的研究。
江西省林业科学院的研究团队通过整合PacBio HiFi长读长测序(66.65 Gb,N50 18.26 kb)和Hi-C染色质构象捕获技术(246.85 Gb),成功构建了染色体水平的雷竹基因组。研究采用Hifiasm算法进行初步组装后,利用Purge Haplotigs去除冗余序列,最终获得包含24条染色体的2,156.14 Mb基因组,scaffold N50达56.48 Mb。通过BUSCO评估显示97.51%的完整性,LAI指数20.03证实其达到参考基因组标准。
基因组注释揭示68.45%为重复序列,其中LTR反转录转座子占比最高(52.82%)。比较基因组学显示雷竹与毛竹(Phyllostachys edulis)基因结构和数量高度相似,系统发育分析证实二者亲缘关系最近。
预测到53,558个蛋白编码基因,平均含4.87个外显子,94.13%的基因获得功能注释。非编码RNA鉴定发现7,745个ncRNA,包括593个miRNA和852个tRNA。
通过CAFE分析发现487个显著扩张基因家族(含2,629个基因),主要富集于氨基酸、糖类和核酸代谢通路。这些基因可能通过优化代谢调控网络,提升竹笋营养和风味物质积累。
该研究首次提供了雷竹染色体水平的高质量基因组资源,不仅填补了竹类植物多倍体基因组研究的空白,更为解析竹笋品质形成的分子机制奠定了基础。发现的代谢相关扩张基因家族为分子设计育种提供了潜在靶点,对开发功能性竹笋食品具有重要指导价值。研究成果发表于《Scientific Data》,数据已公开于NCBI(SRA: PRJNA1081620)和Figshare平台。
生物通微信公众号
知名企业招聘