《Evolutionary Applications》:Sequencing Ultraconserved Elements (UCEs) for Marine Population Genomics: A Proof-of-Concept Using a Deep-Sea Mussel Species
编辑推荐:
本文推荐了一种利用超保守元件(UCE)进行海洋群体基因组学研究的有效方法,通过以深海贻贝Gigantidas platifrons为模型,系统比较了UCE与限制性位点相关DNA测序(RAD-Seq)在解析浅层遗传分化和环境适应性方面的性能。研究证明,即便缺乏高质量参考基因组,UCE捕获测序仍可生成全基因组单核苷酸多态性(SNP),其分辨率与RAD-Seq相当,且具备更广泛的分类适用性和对低质量DNA样本的兼容性,为海洋无脊椎动物保护遗传学提供了新的技术路径。
摘要
超保守元件(UCE)因其对DNA质量要求低、分类适用性广,已成为解析深层进化关系的有力工具。尽管其在种内和浅层分化研究中的应用日益增多,但仅有少数研究探讨了其在海洋类群中的表现,其中一些研究涉及跨越数千公里的集合种群。本研究采用UCE方法研究了深海贻贝Gigantidas platifrons的群体基因组学。该物种具有长的幼虫扩散期,在西太平洋化能合成生态系统中表现出跨广泛分布范围的随机交配遗传结构。凭借其已发表的全基因组和先前使用IIB限制酶的限制性位点相关DNA测序(2b-RAD seq)研究,该物种是评估UCE有效性的优秀候选者。我们对从两个烃渗漏区和四个热液喷口收集的123个个体进行了UCE目标捕获测序,获得了1960个UCE。为了评估不同参考选择的影响,我们通过比对已发表的基因组鉴定了11,870个单核苷酸多态性(SNP),并通过比对代表性的1960个UCE鉴定了8936个SNP。两个数据集相似,超过80%的SNP位于内含子和基因间区。基于两个数据集的分析一致表明,南海(SCS)和冲绳海槽-相模湾(OT-SB)群体之间存在明显的遗传分化,基因流主要从OT流向SB,这与先前发表的2b-RAD seq结果一致。此外,基于UCE的SNP识别出三个区域个体群体规模的动态下降,并揭示了对其环境的选择适应性信号。总体而言,我们的研究作为概念验证,表明即使在缺乏测序基因组的情况下,UCE在检测浅层遗传分化和划定高扩散海洋物种的保护单元方面提供了与RAD-Seq相当的分辨率。
1 引言
群体遗传学为了解等位基因频率在群体内部和群体之间随空间和时间的变化提供了见解。随着全球气候变化和人类活动减少许多自然群体的遗传多样性,理解生物体的群体连通性变得紧迫。等位基因变化通常包括单核苷酸多态性(SNP)、短插入/缺失(indel)和结构变异;其中,SNP最常用于研究自然群体之间的群体水平遗传分化。测序技术的进步使得通过全基因组重测序、限制性位点相关DNA(RAD-Seq)、锚定杂交富集(AHE)等目标富集方法或转录组测序生成SNP数据集用于群体遗传研究成为可能。另一种目标捕获方法,超保守元件(UCE)富集测序,是一种有前途的工具。UCE——在远缘分类群之间共享的高度保守的基因组区域——主要用于解析具有挑战性的深层系统发育关系。由于UCE的侧翼区域含有丰富的变异,Faircloth等人提出它们即使在浅层进化时间尺度上也可能对研究有用。
经验分析表明,对于划分隐存种和检测群体遗传结构,UCE提供与RAD-Seq相当甚至更优的分辨率。RAD-Seq利用限制性酶切获得SNP标记,具有低成本和通量高的优点,但受到低覆盖率、旁系同源混淆和限制性位点分布不均偏差的限制。UCE的关键优势之一是由于其超高的保守性,可以在广泛的分类尺度上使用,便于在不同分类群和研究之间进行比较,而RAD-Seq标记是物种特异性的。UCE与低质量或历史样本的兼容性,结合其广泛的分类适用性,使其成为研究不同海洋类群群体遗传学的多功能工具。几项研究强调了UCE在辨别隐存种和评估脊椎动物(包括海龙、两栖动物、蛇类和鸟类)群体连通性方面的有效性。然而,UCE在海洋无脊椎动物中的应用有限,仅针对少数珊瑚、两种多毛类、一种端足类和两种双壳类物种进行。虽然超过1000个SNP可能足以在没有假阳性的情况下识别遗传结构,但海洋类群的最佳SNP数量仍未经过测试。
尽管高质量基因组是SNP calling的理想选择,但大量无脊椎动物物种缺乏测序基因组。例如,在软体动物门中,超过60,000个现存物种中只有283个具有测序基因组。参考基因组的稀缺通常通过使用用户友好流程(如SqCL)生成的共有序列来克服。然而,关于参考选择后果的综合比较,例如完整基因组与基于UCE的伪参考的有效性,仍然缺乏。最近的UCE研究采用了各种参考来源进行SNP calling,超出了捕获的UCE范围,包括完整基因组和来自个体的巨型组装。值得注意的是,参考质量可能影响变异检测结果,这在实际中仍然是一个未解决的问题,值得进一步研究以增强SNP calling的可靠性和准确性。
本研究旨在比较UCE和RAD-Seq在双壳类群体遗传研究中的功效。具体来说,我们检验了为双壳类(软体动物的一个主要类群,化石记录可追溯到早寒武纪)开发的一组UCE是否可以应用于群体遗传学。我们选择Gigantidas platifrons(先前为Bathymodiolus platifrons)作为测试生物,因为其在西北太平洋深海热液喷口和甲烷渗漏区具有广泛的水平和垂直分布(642–1684米),并且先前关于该物种群体遗传结构和基因流的研究显示出遗传混合。基于一个到几个线粒体基因的等位基因变异,三项研究揭示了从南海到相模湾的群体之间没有遗传分化,表明该物种在整个分布范围内存在随机交配。然而,使用2b-RAD方法(一种形式的RAD-Seq)生成的全基因组SNP,徐等人检测到群体之间存在显著的遗传分化和基因流,特别是在冲绳海槽和南海甲烷渗漏群体之间,突出了选择具有足够分辨率的标记对于群体结构和基因流分析的重要性。因此,G. platifrons是测试为双壳类开发的UCE是否可以成功应用于回答浅层时间尺度进化问题并提供与RAD-Seq相当分辨率的良好候选者。鉴于G. platifrons具有测序基因组,我们还旨在比较通过比对基因组和通过汇集UCE生成的伪参考获得的SNP的功效。
2 材料与方法
2.1 样本收集与DNA提取
为了与先前使用相同物种的群体基因组研究进行比较,我们采用了几乎相同的标本及其提取的DNA样本。如果剩余的DNA样本通过质量控制,则用于UCE文库制备,如下一节所述。否则,使用原始组织重新提取DNA。除了徐等人使用的101个标本外,我们还包括22个标本以增加样本量。简而言之,在2011年至2018年间的九次潜航中,从西太平洋的两个烃渗漏区和四个热液喷口收集了总共123个Gigantidas platifrons样本。这些地点位于四个地理区域:南海(SCS,渗漏)、南冲绳海槽(S-OT,喷口)、中冲绳海槽(M-OT,喷口)和相模湾(SB,渗漏)。样本在各自研究船的主甲板上到达后立即保存在-20°C的无水乙醇中或立即在-80°C冷冻。使用苯酚/氯仿提取方法从每个个体的闭壳肌中提取基因组DNA,通过1.5%琼脂糖凝胶电泳、NanoDrop@2000分光光度计和通过Qubit 4荧光计使用Qubit@dsDNA HS检测试剂盒进行质量和定量评估。
2.2 文库制备、目标捕获富集和高通量测序
使用Diagenode Bioruptor Pico超声破碎仪物理剪切基因组DNA,并在1.5%琼脂糖凝胶上运行电泳以确定片段大小分布。然后将剪切的DNA用于文库制备,包括末端修复、A尾添加、接头连接和使用Invitrogen Collibri PS DNA Library Prep Kit for Illumina Systems进行扩增,应用UD索引为每个文库提供唯一的双索引。每个纯化的连接接头的DNA文库根据其数量通过2–16个循环的聚合酶链反应(PCR)进行扩增。每个文库通过Qubit 4荧光计使用Qubit@dsDNA HS检测试剂盒进行定量,并通过1.5%琼脂糖凝胶电泳确定大小分布。
由于样本间DNA质量的差异,我们将具有相似DNA数量和质量