染色体水平基因组揭示砂仁(Wurfbainia villosa)药用价值与育种潜力

【字体: 时间:2025年08月27日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对传统中药砂仁(Wurfbainia villosa)产业面临的种质退化、产量低下等瓶颈问题,通过ONT+NGS+Hi-C多组学技术,完成2.73Gb染色体水平基因组组装(Contig N50达30.23Mb),锚定24条假染色体并注释42,713个基因。首次揭示该物种88.83%的重复序列特征及LTR转座子主导的基因组结构,为解析其活性成分生物合成通路及分子育种奠定基础。

  

作为"四大南药"之一的砂仁(Wurfbainia villosa),其干燥果实Fructus Amomi在胃肠疾病治疗和食品保健领域应用广泛,年产值超千亿元。然而自然授粉困难、萌发率低等农业难题,加之种质资源遗传多样性匮乏导致的品质退化,严重制约产业发展。更关键的是,作为主要活性成分的挥发油生物合成机制尚未在基因组层面阐明,传统育种缺乏分子标记支撑。

为解决这些问题,Yingmin Zhang等研究团队在《Scientific Data》发表了首个染色体水平的砂仁基因组。研究者整合Oxford Nanopore长读长测序、Illumina短读长校正和Hi-C染色体构象捕获技术,从云南文山采集的样本中构建了2,731.09Mb的高质量基因组。通过19-mer分析预估基因组大小为2,729.62Mb,杂合率仅0.63%。采用NextDenovo组装结合Racon抛光,最终获得Contig N50达30.23Mb的组装结果,其中99.91%序列成功锚定至24条假染色体。

关键方法:样本采自云南文山(23°34'N,104°45'E),使用ONT PromethION P48平台获取108×长读长数据,结合DNBSEQ-T7产出的84×短读长进行校正。Hi-C数据通过Juicer等工具辅助染色体挂载,EDTA软件注释重复序列,MAKER整合三种基因预测方法。

基因组特征:组装评估显示BUSCO完整性达95.1%,重复序列占比88.83%(其中LTR/Copia占55.19%)。Hi-C互作热图证实染色体组装准确性,24条染色体长度介于66.82-155.81Mb之间。与既往研究相比,本组装Contig N50提升3倍以上(表1)。

基因注释:预测42,713个蛋白编码基因,平均含4.97个外显子,平均CDS长度1,105.59bp。注释完整性经BUSCO验证达97.6%,显著优于同类研究(表5)。特别值得注意的是,LTR反转座子占比达78.38%,这种转座子爆发可能驱动了物种适应性进化。

讨论与意义:该研究创制了目前最完整的砂仁基因组资源,其染色体水平组装为解析萜类合成通路(如调控挥发油生成的terpene synthases)提供分子基础。基因组揭示的LTR转座子扩张模式,为解释Zingiberaceae科物种进化提供新视角。提出的DNA-informed breeding策略可突破传统育种瓶颈,对保障"药食同源"作物品质安全具有重大应用价值。

研究首次将砂仁染色体可视化呈现(图1F),其中III-V轨道展示的基因密度与重复序列分布规律,为后续比较基因组学研究提供重要参照。团队特别指出,该资源将加速开发与挥发油含量相关的分子标记,推动实现《中国药典》规定的品质标准化控制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号