西高止山特有陆地腹足类Indrella ampulla的高质量核基因组与线粒体基因组组装及其群体历史研究

《Genome Biology and Evolution》:Nuclear and mitochondrial genome assemblies of Indrella ampulla, a terrestrial gastropod endemic to the Western Ghats

【字体: 时间:2025年10月28日 来源:Genome Biology and Evolution 2.8

编辑推荐:

  本研究针对西高止山特有彩色多态性陆地蜗牛Indrella ampulla基因组资源匮乏的问题,通过Illumina短读长和Oxford Nanopore长读长混合组装策略,成功构建了高质量核基因组(N50=632 kb,BUSCO完整性90.3%)和线粒体基因组(13,887 bp)。PSMC分析揭示该物种在过去10万年间出现种群衰退,为研究腹足类色彩多态性的遗传机制和适应性进化提供了重要基因组资源。

  
在西高止山生物多样性热带的茂密森林中,生活着一种色彩斑斓的陆地蜗牛——Indrella ampulla。这种蜗牛最引人注目的特征是其鲜艳的色彩多态性,存在橙色、红色和黄色三种明显不同的色型。作为阿里奥斐蒂达科(Ariophantidae)的单型物种,它不仅具有重要的生态价值,更是研究腹足类动物适应性进化的理想模型。然而,尽管其生物学特性引人入胜,基因组资源的缺乏严重制约了对其进化机制和色彩多态性遗传基础的深入探索。
腹足类作为软体动物中多样性最丰富的类群,栖息地范围涵盖海洋、河口、淡水和陆地环境,展现出包括扭转现象、毒素产生、壳体和体色多态性等一系列独特适应性特征。然而,南亚地区特别是印度西高止山地区的腹足类基因组学研究明显滞后。为了解决这一瓶颈问题,由Gopi Krishnan、Maitreya Sil等研究人员组成的团队在《Genome Biology and Evolution》上发表了首个Indrella ampulla的高质量基因组图谱。
研究人员采用混合基因组组装策略,结合Illumina短读长和Oxford Nanopore长读长测序技术。从喀拉拉邦Nedumkandam地区采集的红色色型个体中提取DNA,分别产生21.3 Gb长读长数据(3,393,199条reads)和136 Gb短读长数据(4.46亿对末端reads)。通过Flye和MaSuRCA分别进行长读长单独组装和混合组装,再经过两轮QuickMerge整合优化,最终获得六个候选组装版本。选用BUSCO完整性和连续度最优的Assembly 6作为最终版本,其基因组大小为2.37 Gb,contig N50为632 kb。使用RepeatModeler和RepeatMasker进行重复序列注释,GALBA进行基因预测,并利用MitoHiFi和MitoZ进行线粒体基因组组装注释。
1. 核基因组组装统计
最终组装版本显示基因组大小为2.37 Gb,包含15,768个contig,contig N50为632 kb。BUSCO评估显示基因组完整性达93.5%,但存在21.5%的基因重复,这可能源于基因组高杂合性或部分二倍体组装。短读长比对率达到99.49%,Merqury分析显示共识准确度QV值为42.8,相当于每18,910个碱基出现一个错误。与其它异鳃类(Heterobranchia)物种比较,该基因组大小处于已知软体动物基因组变异范围内。
2. 重复序列屏蔽和注释
重复序列注释显示约54%的基因组由转座元件组成,其中LINEs占比最高(25.94%),其次是SINEs、LTR元件、DNA转座子和简单重复序列。基因预测共识别20,418个蛋白质编码基因,BUSCO评估蛋白完整性为87.1%。OMArk分析显示68.03%的蛋白质能稳定归类于软体动物支系,20.24%为未知分类,未检测到污染序列。通过EggNOG-mapper对17,952个基因(87.9%)进行了功能注释。
3. 线粒体基因组组装统计
线粒体基因组为环状分子,全长13,887 bp,包含13个蛋白质编码基因、22个tRNA基因和2个rRNA基因。四个蛋白质编码基因(ATP6、ATP8、ND3和COX3)位于次要链,其余位于主要链。14个tRNA位于正链/主要链,8个位于次要链。蛋白质编码基因包括3个细胞色素c氧化酶亚基(COX1-3)、7个NADH脱氢酶亚基(ND1-6和ND4L)等,与已报道的软体动物线粒体基因组结构一致。
4. 群体历史重建
PSMC分析显示Indrella ampulla的有效群体大小(Ne)在约10万年前开始显著下降,这一趋势与西高止山地区晚更新世气候变化模式相符。该地区在末次冰盛期(LGM)前后降雨模式变化和干旱化加剧可能导致森林栖息地物种的种群衰退。有趣的是,与该地区分布的其它物种(如雀形目鸟类)相比,Indrella ampulla的种群下降开始时间更早,与西高止山亚洲象群体基于基因组数据揭示的历史动态存在相似模式。
该研究首次提供了印度西高止山特有陆地腹足类的高质量基因组资源,填补了南亚地区软体动物基因组学研究的空白。基因组的高连续性和完整性为解析腹足类的色彩多态性、适应性进化及群体历史提供了重要基础。研究揭示的长期种群衰退模式为理解热带亚洲生物多样性形成机制提供了新视角,同时建立的混合组装策略也为其它非模式生物的基因组学研究提供了技术参考。这些基因组资源将有力推动对软体动物独特生物学特征进化机制的研究,特别是在气候变化背景下物种适应性进化研究领域具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号