《All Life》:Exploring mitochondrial genome sequence of swamp deer subspecies (Rucervus Duvaucelii): comparative and phylogenetic insights
编辑推荐:
本文首次对三种沼泽鹿(Rucervus duvaucelii)亚种进行全线粒体基因组(mitogenome)比较分析,揭示其高度保守的基因结构(13个PCGs、22个tRNAs、2个rRNAs)及近缘遗传关系。研究发现亚种间AT含量(约62%)、密码子偏好性(A/T偏向)及选择压力(dN/dS<1)高度一致,控制区(Control Region)的七核苷酸重复 motif 为亚种鉴别提供新标记。系统发育树证实沼泽鹿属单系起源,为濒危物种(IUCN VU)的保育遗传学提供关键分子依据。
Abstract
本研究通过比较三种沼泽鹿亚种(Rucervus duvaucelii duvaucelii、R. d. branderi 和 R. d. ranjitsinhii)的完整线粒体基因组,揭示了它们之间密切的遗传关系。采用新一代测序技术(NGS)无需线粒体特异性引物即可获得 R. d. branderi 的三个线粒体基因组序列(长度分别为16407 bp、16412 bp和16361 bp),并与已发表的7个通过桑格测序获得的 Rucervus 属线粒体基因组进行比较。所有三个亚种的编码基因长度在11403 bp至11461 bp之间,占线粒体基因组总长的69.77%-69.85%。13个蛋白编码基因的A+T含量在亚种间具有可比性。除 trnSer2外,所有转运RNA基因均形成典型的三叶草二级结构,其G+C含量在20.3%至45.2%之间变动。在控制区观察到两个七核苷酸基序。atp8基因的进化速率最高,而cox1基因的进化速率最低。系统发育分析凸显了 Rucervus 属的进化意义,所有10个完整的线粒体基因组序列聚集在一起。
Introduction
沼泽鹿,又称巴拉辛哈鹿,是原产于印度次大陆的鹿科物种,因其大型多叉鹿角而闻名。根据鹿角形态差异,已将其划分为三个亚种。由于栖息地破碎化、偷猎和遗传多样性丧失,该物种被世界自然保护联盟列为易危物种。线粒体DNA分析为了解种群结构、历史群体统计学和进化关系提供了重要见解,这对于设计保护计划至关重要。完整的线粒体基因组序列已广泛应用于解决许多偶蹄目动物的系统发育位置。脊椎动物的线粒体基因组呈环状,编码37个保守基因。多项研究表明,与基于单个或部分线粒体基因序列的分析相比,完整的线粒体基因组能为系统发育提供更高水平的支持。因此,本研究旨在对所有已识别的巴拉辛哈鹿亚种的完整线粒体基因组序列进行全面分析,并评估其遗传多样性,以推断它们在鹿科内的系统发育关系。
Methods
Samples
从印度坎哈老虎保护区的 R. d. branderi 尸体采集组织样本,使用商业试剂盒提取DNA,并通过离子 torrent PGM平台进行鸟枪法文库构建和下一代测序。同时从GenBank检索其他沼泽鹿亚种及鹿科其他代表物种的线粒体基因组序列用于比较分析。
Sequence annotation and alignment
使用MITOS流程和Artemis软件对组装后的序列进行注释。使用tRNAscan-SE软件预测tRNA及其二级结构。使用MEGA 6.06中的ClustalW程序对序列进行比对。计算核苷酸组成、碱基偏斜、相对同义密码子使用频率等。使用OGDRAW软件生成环状基因组图谱。使用Datamonkey服务器估算同义和非同义替代率。使用Tandem Repeats Finder查找串联重复序列。基于Tamura-Nei模型,采用最大似然法推断进化历史。
Results
Genome organisation and composition
获得的三个 R. d. branderi 线粒体基因组大小分别为16407 bp、16412 bp和16361 bp,平均覆盖度分别为50.85X、40.23X和33.66X。所有三个亚种的线粒体基因组均编码37个基因,包括13个蛋白编码基因、2个核糖体RNA基因和22个转运RNA基因,并具有一个AT富集区。大多数基因位于H链上,仅nad6和7个tRNA基因位于L链。三个亚种的A+T含量相似。密码子使用分析显示明显的A/T偏好。氨基酸组成在亚种间无变化。
Protein-coding genes
13个PCGs的总长度占线粒体基因组的约69.8%。亚种间PCGs的A+T含量非常接近。AT偏斜为正值,GC偏斜为负值,表明A碱基多于T,C碱基多于G。所有13个PCGs均以ATN起始,使用TAG、TAA或AGA作为终止密码子。
Ribosomal RNA and transfer RNA genes
rrnS和rrnL的长度及A+T含量在亚种间和鹿科内均相似。除trnSer2外,所有tRNA均能形成典型的三叶草二级结构。在某些tRNA的茎部观察到非经典碱基对。
Overlapping sequences and intergenic spacer regions
亚种间重叠序列相似,最长的重叠位于atp8和atp6基因之间。基因间间隔区的长度在亚种间存在变异。
Control region
控制区长度在亚种间有差异。在所有三个亚种的控制区均观察到两个七核苷酸基序的多次重复,以及一段25 bp重复序列的两个拷贝。
Evolutionary dynamics
大多数密码子位置的ω值小于1,表明线粒体蛋白编码基因受到强烈的纯化选择。细胞色素b基因和控制区表现出较高的多态性。
Phylogenetic relationship
基于39个鹿科物种完整线粒体基因组构建的系统发育树显示,Rucervus属及其三个亚种形成一支受到高支持度的单系群,表明它们具有共同的进化祖先。
Discussion
Genome structure and nucleotide composition
线粒体基因组的结构、基因顺序和核苷酸组成在所有三个亚种中高度一致,并与已报道的其他鹿科物种相似。A+T含量约62%以及碱基偏斜模式符合偶蹄目的普遍趋势。控制区长度的变异可能反映了种群特异性的复制滑动或突变事件,为亚种鉴定提供了潜在标记。
Protein coding genes and codon usage
蛋白编码基因的长度和顺序高度保守。密码子使用模式和氨基酸频率也保守,偏好以A/T结尾的密码子,这反映了线粒体基因组的整体组成偏斜和功能约束。
Transfer and ribosomal RNA genes
tRNA基因的二级结构和rRNA基因的位置、长度在亚种间保守。trnSer2缺乏DHU臂是脊椎动物线粒体基因组的常见特征。
系统发育分析结果与之前基于部分基因或全基因组的研究一致,支持Rucervus属的单系性以及亚种间密切的遗传关系,尽管它们存在生态差异。
Conclusion
本研究揭示了沼泽鹿三个亚种线粒体基因组的高度结构保守性、有限的序列分化以及蛋白编码基因上强烈的纯化选择,表明它们是近期才发生进化分离。研究结果为Rucervus duvaucelii的保护遗传学提供了重要的基因组信息,包括线粒体基因组结构、碱基组成、密码子使用、系统发育关系和进化动力学等方面的见解。了解亚种间的线粒体基因组变异性,为种群监测、再引入和法医鉴定提供了分子框架。本研究也展示了NGS技术在不依赖线粒体特异性引物的情况下解析线粒体基因组的有效性和成本效益。