首个枝手目海参染色体水平基因组图谱揭示Colochirus anceps的进化特征与生物活性潜力

《Scientific Data》:Chromosome-level genome assembly of the sea cucumber, Colochirus anceps

【字体: 时间:2025年10月15日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对枝手目海参基因组资源匮乏的问题,通过整合PacBio HiFi长读长、Illumina短读长和Hi-C测序技术,成功完成了Colochirus anceps的染色体水平基因组组装(大小2,238.33 Mb,Contig N50为15.09 Mb,锚定至23条染色体)。注释获得24,102个蛋白编码基因,发现高达70.95%的重复序列。该基因组是枝手目海参的首个染色体级别参考基因组,为研究海参基因组多样性、进化关系及独特生理性状的遗传机制提供了关键资源。

  
在浩瀚的海洋中,海参作为棘皮动物门的重要成员,不仅在海洋生态系统的物质循环和能量流动中扮演着关键角色,其体内蕴含的多种生物活性物质(如三萜皂苷)更展现出巨大的生物医药应用潜力。然而,海参类群的基因组资源分布极不均衡。根据Miller等人2017年的分类体系,海参纲分为七个目,其中Synallactida目(如刺参Apostichopus japonicus)和Holothuriida目(如黑海参Holothuria leucospilota)的基因组研究较为深入,而枝手目则长期缺乏高质量的基因组参考序列。前期基因组调查分析显示,枝手目海参具有异常大的基因组(约2238-3754 Mb)和极高的重复序列比例,暗示其可能经历了独特的基因组进化路径。因此,获取枝手目代表物种的染色体级别基因组,对于揭示海参类的基因组多样性、进化关系以及独特性状(如警戒色、生物合成能力)的遗传基础至关重要。
Colochirus anceps(曾用名Cercodemas anceps)是一种分布于热带海域(如越南、马来西亚)的枝手目海参,以其醒目的警戒色、在潮间带和海草床生态系统中的沉积摄食功能(促进营养循环和沉积物氧化)以及富含具有抗癌活性的holostane型三萜皂苷(如cercodemasoide A)而备受关注。为了填补枝手目海参基因组资源的空白,研究人员选择了C. anceps作为代表物种,利用多种高通量测序技术,成功构建了其染色体水平的基因组图谱,相关成果发表于《Scientific Data》期刊。
本研究主要采用了以下关键技术方法:从中国福建厦门采集的健康成年C. anceps个体肌肉组织,用于DNA提取。利用PacBio Sequel II平台进行高保真长读长测序,Illumina NovaSeq平台进行短读长和Hi-C测序,并对肌肉、体壁、肠道、呼吸树、神经环、触手和生殖腺等多种组织进行转录组测序以辅助基因注释。基因组组装使用Hifiasm,Hi-C辅助染色体挂载使用AllHiC和Juicebox,基因注释整合了从头预测、同源比对和转录本证据。
基因组调查、组装和质量评估
通过K-mer分析(k=17)预估C. anceps基因组大小约为2,268.5 Mb(校正后为2,238.33 Mb),其大小约为已报道Synallactida目海参基因组的2-3倍。基因组杂合率为1.06%,重复序列比例高达69.39%。使用PacBio HiFi reads进行组装,最终获得大小为2,407,851,961 bp的基因组,包含1,433个contig,contig N50达到15.09 Mb。通过Hi-C技术将95.09%的组装序列锚定到23条染色体上,与其他已发表海参基因组染色体数目一致。BUSCO评估显示基因组完整性达94.3%。短读长比对率高达98.37%,基因组覆盖度达99.36%,质量值Qv为32.73,表明组装具有高度的完整性和准确性。
重复序列和非编码RNA注释
重复序列注释结合了同源和从头预测方法,结果显示重复序列占基因组的70.95%,其中DNA转座子占比最高(42.19%),其次为LINE(12.18%)和LTR(11.88%)。非编码RNA注释鉴定出1,458个miRNA、38,549个tRNA、7,136个rRNA和2,300个snRNA。
蛋白质编码基因预测、功能注释和基因组结构可视化
综合运用从头预测、同源预测和转录本预测方法,共预测出24,102个蛋白质编码基因。基因平均转录本长度为35,790.07 bp,平均CDS长度为1,401.02 bp,平均每个基因含有6.82个外显子。功能注释结果显示,96.6%的基因(23,288个)成功获得功能信息。基因组结构通过Circos图可视化,展示了染色体、基因密度、GC含量、重复序列和LTR数量的分布情况。
本研究成功构建了枝手目海参Colochirus anceps的首个染色体级别参考基因组。该基因组大小为2.24 Gb,具有高重复序列含量(70.95%)和较高的组装质量。研究不仅丰富了棘皮动物的基因组数据库,为海参不同目之间的基因组比较和进化分析提供了关键数据,也为进一步挖掘C. anceps的独特生态适应性(如警戒色、底质适应)和生物医学潜力(如抗癌活性物质生物合成)的遗传基础奠定了坚实的基础。未来,基于该基因组资源,可以深入探究枝手目海参巨大基因组和高重复序列的进化意义,以及其活性成分的生物合成通路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号