《Journal of Neuroendocrinology》:Nonapeptide molecular evolution during the adaptive radiation of Tanganyika cichlids
编辑推荐:
催产素(Oxytocin, OT)和加压催产素(Vasotocin, VT)是脊椎动物中演化保守的九肽(nonapeptides),调控多种生理和行为过程。其受体家族在脊椎动物演化过程中经历了基因重复,促进了功能多样化。本研究利用坦噶尼喀湖(Lake Tang
催产素(Oxytocin, OT)和加压催产素(Vasotocin, VT)是脊椎动物中演化保守的九肽(nonapeptides),调控多种生理和行为过程。其受体家族在脊椎动物演化过程中经历了基因重复,促进了功能多样化。本研究利用坦噶尼喀湖(Lake Tanganyika)多样的慈鲷物种,这些物种在社会表型(social phenotypes)间经历了反复的演化转变,研究人员以此调查了九肽系统的分子演化及其在社会行为中的潜在作用。研究人员基于dN/dS比值进行了正选择(positive selection)分析,并检验了氨基酸变异与两种社会表型的相关性。此外,研究人员还分析了基因表达数据,以探索脑受体表达与社会表型变异之间的关联。研究结果表明,尽管九肽受体的大多数位点受到强烈的负选择(purifying selection)作用,少数位点——主要位于VTR2A(加压催产素2A型受体, Vasotocin Receptor 2A)受体的延伸胞内环3(extended intracellular loop 3, IL3)——显示出正选择的信号。此外,VTR2Aa中的一个特定氨基酸与配对结合(pair-bonding)行为相关,提示其在社会依恋(social attachment)中的潜在作用。基因表达分析进一步揭示,九肽系统的组分,包括VTR2Bb和OT,在不同社会表型间存在差异表达,支持调控变异与编码区变化共同作用的观点。这些发现共同揭示了保守的神经内分泌系统如何促进慈鲷社会多样性的新见解。
本研究发表于《Journal of Neuroendocrinology》,旨在探究九肽激素系统(OT/VT系统,包括OT、VT及其受体)的分子演化与基因调控是否与坦噶尼喀湖慈鲷适应性辐射过程中社会表型的演化相关。研究人员聚焦于两个反复演化的社会性状:(i)配对结合与非配对结合交配系统;(ii)双亲抚育与单亲(仅母方)抚育。
坦噶尼喀湖慈鲷的适应性辐射产生了243种特有物种,这些物种在分类上属于12个族(tribes),表现出广泛的表型多样性,包括社会行为的变异。该系统中多次独立发生了社会表型间的演化转变,使其成为比较研究的理想材料。九肽系统在调控社会配对结合和亲代抚育方面已有先前研究证实。然而,关于该系统如何在分子层面促进社会系统多样化的问题尚未得到充分解答。
研究人员首先利用全基因组组装数据表征了九肽配体和受体的基因组库容及结构变异。研究采用尼罗罗非鱼(Oreochromis niloticus)作为参考基因组,因其为注释良好的慈鲷基因组且与各坦噶尼喀慈鲷物种的系统发育距离大致相等。研究人员利用Illumina全基因组原始测序数据为所有可用物种构建了从头组装(de novo assemblies),并通过Bwa-mem进行序列比对。转录组原始测序数据(Bioproject PRJNA552202)则通过STAR比对器比对至参考基因组,涵盖六个组织(脑、鳃、下咽颌、肝脏 Pastor.pending 肝、卵巢和精巢)以及74个物种的4至6个个体。
在鉴定尼罗罗非鱼基因组中九肽前体和受体基因的完整库容时,研究人员使用了斑马鱼(Danio rerio)和日本青鳉(Oryzias latipes)作为参考,其受体库容已得到良好表征。通过蛋白BLAST搜索,在尼罗罗非鱼基因组中鉴定出OT、VT以及八个受体基因,包括两个OT受体(OTR)、两个VTR1A、两个VTR2A和两个VTR2B。基于与多个硬骨鱼类物种的序列相似性,研究人员确定了各基因的类型归属。随后,研究团队在六个代表不同族的长读长(PacBio)组装中验证了这些基因的存在和拷贝数,发现所有组装中均存在每个基因的清晰匹配。
本研究的关键技术方法主要包括:(1)基于全基因组测序数据的从头组装与物种特异性共有序列构建;(2)利用长读长组装结合Illumina覆盖度数据分析基因结构变异;(3)使用MAFFT进行多序列比对,并通过PAL2NAL进行密码子水平比对;(4)采用密码子替换模型计算核苷酸多样性指数(π)及同义替换率;(5)使用HyPhy软件包中的固定效应似然法(Fixed Effects Likelihood, FEL)进行基因水平和位点特异性的dN/dS正选择分析;(6)运用BayesTraits软件的离散性状比较方法,通过马尔可夫链蒙特卡罗(MCMC)和踏石采样器(stepping stone sampler)评估社会表型间的相关演化;(7)利用El Taher等人提供的每百万计数归一化(CPM-normalized)数据集进行组织表达分析;(8)应用MCMCglmm包拟合系统发育广义线性混合模型(Phylogenetic Generalized Linear Mixed Models, PGLMMs),以评估脑基因表达水平与社会行为之间的关联。
3.1 九肽系统基因库容
在尼罗罗非鱼基因组中,研究人员鉴定到OT和VT两个非apeptide前体基因以及八个受体基因。基于与远缘硬骨鱼类物种的序列相似性,确定了以下基因库容:两个OTR、两个VTR1A、两个VTR2A和两个VTR2B。在坦噶尼喀慈鲷的六个长读长组装中,每个参考基因均找到单一清晰匹配。两个非apeptide前体基因位于同一scaffold,呈头尾相连构象,间隔40-50 kbp。预测的九肽氨基酸序列遵循典型的硬骨鱼类OT(CYISNCPIG)和VT(CYIQNCPRG)序列。所有受体的位置分布与尼罗罗非鱼基因组中的染色体分布一致。除VTR2Ab基因存在66 bp缺失外,所有基因均表现出高度保守的蛋白编码域结构。研究人员选择了15个在蛋白编码序列中存在差异的剪接变体用于正选择分析,并额外纳入一个来自其他慈鲷注释的转录本。
3.2 九肽及其受体的结构
预测的非apeptide前体前蛋白遵循已知的保守结构,包括信号肽、激素部分、GKR残基、神经垂体蛋白(neurophysin)和copeptin。所有受体基因至少有一个异构体表现出经典的七个跨膜(TM)结构域,三个胞内环(IL1-3)和三个胞外环(EL1-3)交替排列。部分选择性剪接形式偏离经典G蛋白偶联受体(GPCR)结构,导致较短的异构体具有更少的TM域和环。VTR2Ab基因的66 bp缺失位于延伸的IL3中。
3.3 九肽系统基因的核苷酸多样性
OTRa在所有基因中表现出最低的核苷酸多样性(π),其次为OTRb、VTR1Aa和VTR2Ba。两个非apeptide前体显示中等水平的变异性,而VTR2A拷贝显示最高的多样性值。在结构域层面,末端区域变异性最高,而TM域及胞外和胞内环变异性较低。值得注意的是,来自VTR2Aa和VTR2Ab的两个延伸IL3在所有IL3中显示出最大的核苷酸多样性。此外,两个VTR2A拷贝的C末端域也是最可变的区域之一。
3.4 九肽系统基因的正选择
基于基因树和物种树的dN/dS分析显示,所有基因普遍受到负选择。OTRa的ω值最低(ω=0.1),而两个非apeptide前体显示相对较高的值。位点特异性分析发现,335个位点受到负选择,15个位点受到正选择。受体中近一半的负选择位点(42%)属于TM域,其次为IL(26%)和EL(16%)。非apeptide前体基因未检测到正选择位点。OTRa无正选择位点,OTRb仅有一个(p=0.046)。VTR1Aa有两个正选择位点,VTR2Aa有两个,其中IL3中的一个位点高度显著(p=0.0004)。VTR2Ab的正选择位点最多,共六个,包括其经典拷贝VTR2Ab.tr2延伸IL中的四个。这些发现表明,尽管整体受体结构在强负选择下保持保守,但负责信号转导的IL3区域存在演化灵活性。
3.5 孵卵与配对结合表型的相关性
研究发现两个性状在坦噶尼喀适应性辐射中强相关(log BF 84.36)。可逆跳转分析表明,坦噶尼喀慈鲷的祖先状态很可能是双亲抚育物种(~92%概率),且很可能是配对结合物种(~74%概率)。这些二分类性状的演化似乎朝向母系和非配对结合物种的方向进行。配对结合行为在仅母系抚育时似乎容易丢失,而获得配对结合行为则不太可能。
3.6 行为表型与单核苷酸多态性(SNPs)的相关性
在1098个检测的位点中,仅VTR2Aa转录本第369位氨基酸显示出与配对结合相关的演化证据。该位点在非信息性先验下得到log BF为2.5,在使用开发者推荐先验的可逆跳转框架下,依赖模型优于独立模型(log BF 6.67),表明相关演化获得强支持。该单核苷酸多态性对应缬氨酸到丙氨酸的替换。分析进一步提示配对结合物种中存在丙氨酸的限制。缬氨酸是该位置的主要氨基酸,存在于配对结合和非配对结合物种中,而丙氨酸主要与配对结合类群相关。
3.7 组织表达与行为表型
非apeptide前体几乎仅在脑组织中表达,这是其主要产生部位。OTRa主要在脑中表达,而OTRb在鳃中表达很高。VTR1Aa在鳃、下咽颌和精巢中表达,脑中表达较少。所有VTR2在脑中均有表达。VTR2Aa在不同组织中广泛表达,肝脏中的高表达与以往报道的其在碳水化合物代谢中的作用一致。VTR2Bb在卵巢和精巢中表达,与其他研究一致。
3.8 非apeptide基因表达与社会表型的关联
基于Geweke诊断,所有模型均表现出充分的MCMC性能。VTR2Bb在配对结合物种中表达显著更高(后验均值=0.5,95%最高后验密度[HPD]=[0.13, 0.90],pMCMC=0.011),在双亲抚育者中也更高(后验均值=0.45,95% HPD=[0.05, 0.84],pMCMC=0.027)。OT在双亲物种中表达更高(后验均值=0.45,95% HPD=[0.11, 0.82],pMCMC=0.010)。性别特异性表达模式在OT、VT和VTR2Aa中一致观察到:两个配体在雄鱼中表达高得多,而VTR2Aa在雌鱼中表达增加。稳定同位素效应普遍较弱,仅VTR2Bb随δ
13C增加表达降低,VTR1Aa随δ
13C增加表达升高。
本研究的主要结论如下:坦噶尼喀慈鲷辐射中的九肽前体和受体基因受到强烈的负选择。虽然正选择罕见,但少数受选择位点主要集中在VTR 2A的延伸IL中,提示潜在的功能多样化。此外,相关分析突出了九肽受体在塑造社会表型中的作用,强化了其在慈鲷社会行为演化中的角色。具体而言,编码和调控组分均参与了社会系统的多样化:VTR2A受体延伸IL3的结构变异与配对结合行为相关,而VTR2Bb和OT的表达差异则与社会表型相关联。这些发现支持保守的神经内分泌通路通过精细调控实现社会系统重复转变的观点。