沙蟋基因组破译:揭示沙丘蟋蟀前翅折叠的进化奥秘
《Scientific Data》:Chromosome-scale genome assembly of the dune cricket Schizodactylus jimo
【字体:
大
中
小
】
时间:2025年12月23日
来源:Scientific Data 6.9
编辑推荐:
为揭示沙蟋科昆虫独特的翅折叠形态及沙丘适应性的遗传基础,研究人员利用PacBio HiFi长读长、Illumina短读长及Hi-C测序技术,成功构建了沙蟋(Schizodactylus jimo)的高质量染色体级别基因组。该基因组大小为1.33 Gb,包含9条假染色体,注释出12,612个蛋白质编码基因。该资源为研究直翅目昆虫的进化适应及功能基因组学提供了重要基础。
在昆虫的演化长河中,直翅目(Orthoptera)的蟋蟀、螽斯等成员以其多样的形态和生态适应性而著称。其中,沙蟋科(Schizodactylidae)是一个形态极为独特的类群,它们拥有显著膨大、叶状的跗节,是沙丘环境的特化居民。这些夜行性的“掘洞者”白天藏身于自掘的隧道中,夜晚才出来觅食活动。然而,该科现存物种多样性极低,仅包含2属15种,且分布区高度隔离。更引人注目的是,沙蟋属(Schizodactylus)的物种大多拥有一个独特的形态特征——前翅折叠。这种特殊的翅折叠方式,使其在形态上与其他直翅目昆虫截然不同,但其背后的遗传机制和进化意义却因缺乏高质量的基因组资源而一直悬而未解。
为了填补这一空白,由中国科学院动物研究所葛斯琴研究员和昆明动物研究所李学燕研究员领衔的研究团队,对2021年在中国云南发现的新物种——即墨沙蟋(Schizodactylus jimo)进行了深入研究。他们利用多组学测序技术,成功构建了该物种的高质量染色体级别基因组,相关成果于2025年发表在《Scientific Data》上。
研究人员采集了来自云南保山怒江边的即墨沙蟋雄性成虫样本,利用CTAB法提取了高质量的高分子量DNA。随后,他们整合了多种测序技术:利用PacBio Revio平台进行HiFi长读长测序(83.51 Gb),利用Illumina NovaSeq 6000平台进行短读长测序(327.65 Gb)和Hi-C测序(110.19 Gb),并利用RNA-seq测序(11.71 Gb)辅助基因注释。通过Hifiasm软件进行初步组装,并利用Hi-C数据通过YAHS软件将重叠群锚定到假染色体上,最终构建了高质量的染色体级别基因组。
研究团队成功构建了即墨沙蟋的高质量染色体级别基因组。该基因组大小为1.33 Gb,包含111个Scaffold和164个Contig,Scaffold N50高达216.22 Mb,Contig N50为45.88 Mb。通过Hi-C数据辅助,成功将92.12%的序列锚定到9条假染色体上,总长度为1.23 Gb。基因组评估显示,BUSCO(Benchmarking Universal Single-Copy Orthologs)完整性高达98.1%,短读长、HiFi读长和RNA-seq读长的比对率分别达到99.01%、98.99%和97.04%,表明该基因组在连续性和完整性方面均达到了极高水平。
对基因组重复序列的分析显示,即墨沙蟋基因组中重复序列含量为45.74%,属于中等偏高的重复基因组。其中,长散在核元件(LINE)占比最高,达到23.30%,其次是未知重复序列(11.85%)、短散在核元件(SINE, 3.10%)、DNA转座子(2.97%)和长末端重复序列(LTR, 0.59%)。通过Kimura 2-parameter(K2P)分歧度分析,研究人员发现该基因组的转座子经历了两次主要的扩张事件:一次是主要由未知重复序列贡献的远古扩张,另一次是主要由LINE重复序列贡献的近期扩张。
研究人员对非编码RNA进行了系统注释,共鉴定出5,395个ncRNA,包括1,699个rRNA、74个miRNA、1,306个snRNA(含1,289个剪接体RNA)、1,475个tRNA、4个核酶和2个lncRNA。在蛋白质编码基因方面,通过整合从头预测、同源预测和转录组预测三种方法,共注释出12,612个蛋白质编码基因。这些基因平均长度为27,906.6 bp,平均每个基因包含8.7个外显子、7.7个内含子和8.3个编码序列(CDS)。功能注释显示,93.25%的基因在UniProtKB数据库中有匹配记录,InterProScan和eggNOG-mapper分别注释了10,438个和11,610个基因,并预测了9,921个GO条目和4,738个KEGG通路条目。
本研究成功构建了即墨沙蟋(Schizodactylus jimo)的高质量染色体级别基因组,该基因组在连续性、完整性和准确性方面均达到了极高水平。通过对重复序列、非编码RNA和蛋白质编码基因的系统注释,揭示了该物种独特的基因组特征,特别是其较高的重复序列含量和转座子扩张历史。该基因组资源的发布,为深入解析沙蟋科昆虫独特的翅折叠形态、沙丘环境适应性以及直翅目昆虫的进化历史提供了宝贵的遗传学基础,将极大地推动未来比较基因组学和功能基因组学研究的开展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号