染色体水平基因组组装揭示中华金龟甲(Kibakoganea sinica)的生态适应与进化机制

【字体: 时间:2025年06月18日 来源:Scientific Data 5.8

编辑推荐:

  本研究为解决金龟科(Scarabaeidae)物种高质量基因组资源匮乏的问题,通过整合PacBio HiFi、Illumina和Hi-C测序技术,首次完成中华金龟甲(Kibakoganea sinica)染色体水平基因组组装(601.44 Mb,锚定率99.57%)。研究揭示其44.43%重复序列特征及12,940个蛋白编码基因,BUSCO评估完整度达99.2%,为金龟甲科食性分化(coprophagous/phytophagous)和木质纤维素降解的分子机制研究奠定基础。

  

在昆虫纲庞大的多样性中,金龟科(Scarabaeidae) beetles以其超过35,000个物种的规模占据重要生态位。这类甲虫不仅承担着分解粪便(coprophagous)和植物残体(phytophagous)的关键生态功能,其特殊的消化系统还能降解顽固的木质纤维素11
。然而,该科物种的高质量基因组资源长期匮乏——截至2025年4月,NCBI数据库中仅13个物种达到染色体水平组装,大多数短读长测序数据的scaffold N50
不足100 kb,严重制约了对其环境适应与食性特化机制的研究。

为突破这一瓶颈,信阳师范学院地理科学学院的研究团队选取中国贵州采集的中华金龟甲(Kibakoganea sinica)蛹为研究对象,通过多组学技术构建了该物种染色体水平基因组。研究整合PacBio HiFi(61.02×覆盖度)、Illumina(93.26×)和Hi-C(97.36×)数据,经Hifiasm初组装后采用Purge_Dups去冗余,最终获得601.44 Mb的高质量基因组,其scaffold N50
达60.23 Mb,10条染色体锚定598.84 Mb序列。

关键技术方法包括:1)采用GenomeScope v2.0预估基因组特征(567-568 Mb,重复序列31.58%);2)通过3D-DNA和Juicebox完成Hi-C辅助染色体挂载;3)结合MAKER流程整合转录组、同源蛋白(如黑腹果蝇Drosophila melanogaster)和ab initio预测注释基因;4)利用RepeatModeler2和Dfam数据库分析重复元件;5)通过BUSCO v5.0.4评估组装完整性。

基因组组装

基于HiFi长读长和Hi-C数据的组装显示,最终基因组大小与k-mer分析预估一致(图1)。经污染过滤后,23个scaffold中99.57%序列锚定至10条染色体(Chr01-Chr10),长度16.33-103.53 Mb(表3)。TeloExplorer检测到所有染色体两端均存在(TTAGG)n
端粒重复(表3),而Hi-C热图(图2)和环形特征图(图3)直观展示了染色体的连续性与结构特征。

基因组注释

重复序列占比达44.43%,其中DNA转座子(17.00%)和LINEs(6.81%)为主要类型(表4)。ncRNA鉴定发现312个tRNA和74个miRNA。蛋白编码基因预测显示12,940个基因,平均含6.3个外显子,BUSCO评估显示95.2%单拷贝基因完整性(表4)。功能注释揭示11,414个COG类别和5,009条KEGG通路,涉及木质纤维素降解相关酶系。

该研究首次提供金龟甲科植物食性物种的染色体水平参考基因组,其高连续性(contig N50
24.49 Mb)和完整度为比较基因组学研究设立新标准。特别值得注意的是,267.24 Mb重复序列的精确注释为研究转座子驱动进化提供素材,而预测的12,940个基因中80.6%单拷贝BUSCOs表明注释可靠性。这些发现不仅填补了Pleurosticti类群基因组空白,更为理解鞘翅目昆虫从腐食到植食的适应性辐射机制提供了分子框架。未来可基于此开展食性相关CAZymes(碳水化合物活性酶)的进化分析,或通过多组学整合揭示肠道共生菌与宿主协同降解木质纤维素的奥秘。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号