
-
生物通官微
陪你抓住生命科技
跳动的脉搏
首例蜡蚧属染色体水平基因组揭示软蚧科昆虫的入侵与生态适应机制
【字体: 大 中 小 】 时间:2025年07月06日 来源:Scientific Data 5.8
编辑推荐:
本期推荐研究人员针对软蚧科(Coccidae)害虫基因组资源匮乏的问题,通过整合Nanopore长读长测序、Hi-C染色质构象捕获等技术,完成了首例蜡蚧属昆虫Ceroplastes pseudoceriferus染色体水平基因组组装(364.14 Mb,N50 21.24 Mb),锚定18条染色体并注释10,475个功能基因。该研究为解析多食性害虫的入侵机制及开发生物防治策略提供了关键分子基础。
研究背景
软蚧科昆虫作为全球第三大介壳虫类群,其多食性特征导致91属56科植物遭受侵害,每年造成重大农业经济损失。这类害虫通过与天敌昆虫、寄生蜂的复杂互作影响生态系统平衡,但基因组资源的稀缺严重阻碍了其生物学研究。目前GenBank仅收录6个软蚧科基因组,其中仅1个达到scaffold水平。Ceroplastes pseudoceriferus作为典型多食性入侵物种,其基因组解析将有助于揭示宿主适应性进化机制。
廊坊师范学院生命科学学院联合中国中医科学院的研究团队,通过整合多组学数据构建了首个蜡蚧属染色体水平参考基因组,相关成果发表于《Scientific Data》。研究采用35.11Gb MGI短读长、102.21Gb Nanopore长读长和77.20Gb Hi-C数据,经NextDenovo组装和NextPolish校正,最终获得连续性指标优异的基因组(contig N50 6.16Mb)。
关键技术方法
样本采集自云南昆明单株樟树的一龄若虫,通过Hi-C技术将99.89%序列锚定至18条染色体。采用GMATA和TRF鉴定串联重复序列,结合RepeatModeler预测转座元件。基因预测整合GeMoMa同源比对、RNA-seq转录本及Augustus从头预测结果,经EVM整合获得10,475个基因模型。功能注释通过InterProScan和五大数据库(SwissProt/NR/KEGG/KOG/GO)完成。
研究结果
基因组特征
组装基因组大小364.52Mb,重复序列占比53.98%,其中DNA转座子(32.54%)和LTR反转录转座子(3.42%)为主要成分。检测到23,595个串联重复序列,包含10,466个SSR(简单序列重复)。
非编码RNA注释
鉴定出31个rRNA(含6个18S和28S)、75个小RNA(含23个miRNA)及204个tRNA,揭示非编码RNA调控网络基础。
基因注释与功能分析
预测基因平均含8.54个外显子,CDS平均长度1,701bp。BUSCO评估显示92.54%的保守基因完整性(单拷贝85.15%),9503个基因(90.72%)获得功能注释。KEGG通路分析显示显著富集于代谢和信号转导相关通路。
结论与意义
该研究首次建立软蚧科染色体水平基因组标准,揭示转座元件扩张可能是宿主适应性进化的重要驱动力。基因组数据为解析多食性害虫的生态位分化、抗药性演变提供了分子靶点,对开发基于RNAi的精准防控技术具有指导价值。研究建立的Hi-C锚定策略(LACHESIS参数CLUSTER_MIN_RE_SITES=100)为小型昆虫基因组组装提供了技术范本。
生物通微信公众号
知名企业招聘