野生柳枝稷高质量染色体级别基因组组装及其比较基因组学分析

《Scientific Data》:A high-quality chromosome-scale genome assembly of the wild sorghum (Sorghum virgatum)

【字体: 时间:2025年10月01日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对野生柳枝稷(Sorghum virgatum)基因组资源匮乏的问题,通过PacBio HiFi测序与Hi-C技术成功构建了795 Mb的染色体级别参考基因组(scaffold N50达62.47 Mb)。研究预测出27,851个蛋白编码基因,揭示基因组中71.86%为重复序列,并通过与栽培高粱比较发现4,279,067个SNPs和725,689个InDels。该基因组为禾本科作物进化研究和基因组驱动育种提供了关键资源。

  
在非洲东北部的河岸与灌溉渠边,生长着一种叶片极窄(宽度常不足2厘米)、花序纤细的野生植物——野生柳枝稷(Sorghum virgatum)。作为高粱四大野生祖先亚种之一,它不仅具有强大的抗逆性,还能与现代栽培高粱杂交,成为挖掘关键驯化基因的宝库。然而,由于缺乏高质量的基因组参考序列,科学家们难以系统解析其遗传特性与栽培高粱的进化关系。
为破解这一难题,中国农业大学林忠伟团队在《Scientific Data》发表了染色体级别的野生柳枝稷基因组图谱。研究结合PacBio HiFi长读长测序与Hi-C三维基因组技术,构建了总长795 Mb的基因组,scaffold N50高达62.47 Mb。BUSCO评估显示基因组完整性达98.02%,LAI指数为22.08,达到“黄金标准”参考基因组水平。
关键技术方法
研究采用CTAB法提取基因组DNA,通过PacBio Sequel II平台生成HiFi数据,并利用hifiasm软件进行组装。Hi-C文库经DNBSEQ平台测序后,使用3D-DNA和Juicebox进行染色体挂载与纠错。基因注释整合了RNA-seq(根、叶、茎、种子和花序五类组织转录组)、同源比对和de novo预测结果,通过EvidenceModeler整合生成最终基因模型。
基因组特征分析
重复序列注释:EDTA流程检测显示71.86%的基因组为重复序列,其中LTR反转录转座子占比54.99%,TIR元件占7.90%。重复序列的全面注释为解析基因组进化动力学奠定了基础。
基因模型构建:共预测27,851个蛋白编码基因,BUSCO评估显示95.66%为完整单拷贝基因,表明注释结果高度可靠。
比较基因组学:与栽培高粱(Sorghum bicolor v3)比对发现30,472个PAVs(存在/缺失变异)、4,279,067个SNPs和725,689个InDels。MCScanX分析揭示了显著的基因共线性,为驯化相关基因的定位提供线索。
结论与意义
该研究不仅提供了首个野生柳枝稷的高质量基因组,还通过多组学数据揭示了其与栽培高粱的结构变异规律。基因组数据已公开于NGDC(PRJCA035881)和NCBI(GCA_051168655.1),为禾作物进化研究和基因组设计育种提供了不可替代的资源。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号