编辑推荐:
为解决鸟类趋同进化分子机制及跗骨长度演化相关问题,研究人员开展鸟类跗骨长度趋同进化研究。结果发现其与保守元件替代率加速有关,且与调控区相关而非蛋白编码基因。推荐阅读,助您深入了解鸟类进化奥秘。
在奇妙的生物进化世界里,有一种现象十分有趣,那就是趋同进化(Convergent evolution)。趋同进化指的是在生命之树中,没有亲缘关系的物种却各自独立进化出了相似的特征。比如鸟类中,有些善于飞行的鸟类和擅长游泳的鸟类,它们虽然属于不同的种类,但却都进化出了适合各自生存方式的身体特征。这种现象引起了科学家们浓厚的兴趣,他们想知道在分子层面,趋同进化背后的机制到底是什么。
随着科技的发展,大量高质量的基因组序列被测定出来,这为研究趋同进化提供了很好的条件。科学家们发现,趋同进化在分子层面的表现多种多样,从共享的单核苷酸替换,到蛋白质编码基因的平行速率变化,再到调控序列的重复变化等。然而,目前的研究还存在一些问题。虽然研究手段越来越多,但 “反向基因组学” 研究范式严重依赖于识别趋同表型背后相同的基因座或基因网络,如果不同的基因座或网络导致了趋同表型,那么系统发育和比较方法的作用可能就会受到限制。
在鸟类研究方面,鸟类因其相对较小且不太复杂的基因组,以及丰富的表型数据,成为研究趋同进化的理想对象。但之前大多数将鸟类分子和表型特征联系起来的研究,都集中在少数几个分类群上,缺乏对鸟类物种多样性的全面研究,也没有系统地研究趋同进化表型与基因组数据之间的关系。
为了深入探究这些问题,研究人员开展了一项重要的研究,并在《BMC Biology》期刊上发表了名为 “Convergent regulatory evolution of conserved non - exonic elements underlies tarsus length evolution in birds” 的论文。通过研究,他们得出结论:鸟类跗骨(tarsus)长度的趋同变化与肢体发育途径附近基因的保守元件中加速的替代率密切相关,这表明调控元件在趋同骨骼特征的进化中发挥了重要作用,而蛋白质编码基因在这一过程中并没有明显的趋同信号。这一研究成果意义重大,它不仅揭示了鸟类跗骨长度进化的分子机制,还为后续研究趋同进化提供了重要的参考,为我们理解生物进化的奥秘打开了新的窗口。
在这项研究中,研究人员运用了多种关键技术方法。他们利用多状态的 Ornstein–Uhlenbeck 模型(OU),结合 AVONET 数据库中的跗骨长度数据和鸟类系统发育树,来识别鸟类跗骨长度的趋同变化;通过 ProgressiveCactus 软件对 79 个鸟类基因组进行比对,生成保守元件数据集;运用 PhyloAcc 软件检测保守非外显子元件(CNEEs)的加速进化;使用改进的 McDonald–Kreitman 测试,结合群体遗传数据来检测正选择作用。
下面我们来详细看看研究结果。
1. 鸟类跗骨长度的多次变化
研究人员为了找出鸟类群体中跗骨长度的趋同变化,利用了 AVONET 这个全面的功能性状数据库,选取了 5405 种有遗传数据代表的鸟类。他们通过拟合多状态的 OU 模型,发现了在这部分鸟类中,跗骨长度有七次多分类群的变化。其中两次变化是跗骨变长,而另外五次是跗骨变短,涉及到包括企鹅、翠鸟、燕子和鹎等多个类群。基于基因组资源的可用性,研究人员重点关注了企鹅、翠鸟、燕子和鹎这四个向较短最优跗骨长度转变的类群。通过测量博物馆标本中的跗跖骨(tarsometatarsus),他们验证了这四个类群的跗骨长度确实比各自的姐妹群短。同时,研究人员还比较了其他两块肢骨 —— 股骨(femur)和胫跗骨(tibiotarsus),发现不同类群的缩短情况有所不同,比如燕子的整个肢体都缩短,而企鹅和鹎只是胫跗骨较短,翠鸟则是股骨较短。
2. 鸟类保守元件的综合目录
为了生成鸟类保守元件的综合数据集,研究人员将之前已发表的几套鸟类保守元件数据集与新生成的数据集相结合。他们选取了 79 个鸟类基因组进行 ProgressiveCactus 比对,这些基因组涵盖了多个类群,且大多质量较高。通过 phastCons 软件估计保守元件,研究人员得到了大量的保守元件,经过筛选,最终确定了 932,467 个保守元件。这些元件在基因组中分布广泛,且在编码区域的比例较高。为了了解这些保守元件的潜在调控功能,研究人员利用已发表的 ATAC - seq 数据,重新分析得到了鸡胚胎多个组织的 ATAC - seq 峰。结果发现,保守元件在 ATAC - seq 峰中显著富集,这表明它们可能具有重要的调控作用。
3. 短跗骨类群中假定调控元件的趋同进化加速
研究人员使用 PhyloAcc 软件来识别短跗骨类群中保守元件的加速和趋同模式。他们运行了三个模型,通过贝叶斯因子比较,确定了 14,422 个在至少一个短跗骨物种中加速的 CNEEs。进一步筛选后,得到了短跗骨广泛数据集和短跗骨特异性数据集。通过超几何检验和 Fisher 精确检验,发现短跗骨加速元件在四个重点类群之间存在趋同共享现象。比如在短跗骨广泛数据集中,燕子、翠鸟和企鹅之间共享加速元件的情况比随机预期的要多;在短跗骨特异性数据集中,鹎和企鹅、企鹅和翠鸟、企鹅和燕子之间也存在共享加速元件的现象。
4. 短跗骨加速元件的正选择证据
虽然 PhyloAcc 软件可以检测到保守元件的保守状态变化,但不能确定这种变化是由正选择还是约束丧失引起的。因此,研究人员利用群体遗传数据,以鹎(Brachypodius atriceps)和燕子(Hirundo rustica)为例进行研究。他们使用了改进的 McDonald - Kreitman 测试,将非编码区域的固定和多态位点与附近的中性标准进行比较。结果发现,在鹎和燕子中,分别有一定数量的元件显示出正选择和放松约束的证据。虽然没有发现显著富集的 GO 术语,但在一些与肢体发育相关的基因附近,发现了正选择的元件。此外,研究人员还对基因附近的保守元件簇进行分析,发现了一些与肢体发育相关的基因附近存在正选择的元件簇。
5. 短跗骨加速元件与开放染色质和肢体发育基因相关
研究发现,在短跗骨谱系中加速的 CNEEs 比随机选择的保守元件更有可能位于开放染色质区域。通过 TACIT 这个基于卷积神经网络的机器学习方法,研究人员预测了其他物种中元件的开放概率。结果发现,一些与肢体发育相关的基因附近的元件,在短跗骨目标谱系中存在开放状态的变化。通过 PANTHER 进行功能富集分析,研究人员发现短跗骨加速元件相关的基因在肢体发育等生物过程中显著富集,特别是在短跗骨特异性数据集中,与胚胎骨骼系统发育、软骨细胞分化和前肢形态发生等相关的 GO 类别显著富集。
6. 已知影响肢体功能的基因的基因水平调控趋同
研究人员在已知的肢体发育途径中寻找加速的 CNEEs,发现了多个与骨骼和肢体发育途径相关的基因簇。其中,FGF10 和 PITX1 这两个基因尤为显著,它们在早期胚胎肢体发育中起着重要作用,其附近的多个元件在多个重点类群中加速。此外,MEIS1、Hox 基因、SOX9 以及 Wnt 通路的相关基因等也显示出基因水平的趋同加速。这些基因在肢体发育的不同阶段发挥作用,它们的调控变化可能共同影响了短跗骨表型的进化。
7. 加速元件中的物种特异性基序变化
研究人员使用 MAST 软件对已知肢体发育途径中的基因进行基序注释,发现了一些加速元件在特定重点谱系中存在物种特异性的基序结合位点增益。比如在燕子中,靠近 ETS1 的一个加速元件出现了 Meis1 和 Fos 的新基序;在翠鸟中,Hox 簇 a9 - a11 附近的加速元件出现了潜在的 Tbx4 基序,靠近 SOX9 的加速元件出现了 Tbx18 基序;在鹎中,靠近 SMAD2 的加速元件出现了 Hoxc12 基序。这些基序的变化可能与肢体发育的调控有关,虽然一些相互作用尚未被报道,但可能通过冗余的 Hox 基因促进了相似的形态变异。
8. 正选择基因在短跗骨重点类群中未显示趋同选择
研究人员通过多种方法检测蛋白质编码序列的趋同进化,却没有找到相关证据。他们使用 TOGA 软件获得一对一的直系同源基因座,通过 aBS - REL 软件检测正选择,发现虽然在一些短跗骨重点类群中存在正选择的基因,但这些基因在不同类群之间并没有显示出趋同选择的信号。利用鹎和燕子的群体重测序数据进行 McDonald - Kreitman 测试,也没有检测到趋同正选择。不过,在正选择的基因中,发现了一些重要的肢体发育基因,这表明可能存在谱系特异性选择作用于蛋白质编码基因,对短跗骨表型的进化产生影响。
综合研究结论和讨论部分,这项研究意义非凡。研究人员通过对鸟类跗骨长度的研究,揭示了趋同进化在分子层面的机制。他们发现,鸟类跗骨长度的趋同变化与保守元件的加速进化密切相关,这些保守元件大多位于肢体发育相关基因附近,且在调控元件上表现出趋同进化,而蛋白质编码基因的趋同信号并不明显。这一结果不仅为理解鸟类肢体进化提供了重要依据,也为其他生物的趋同进化研究提供了范例。研究中生成的大量保守元件数据集以及运用的研究方法,为后续研究提供了宝贵的资源和参考,有助于科学家们更深入地探索生物进化的奥秘,进一步揭示生命之树中各种奇妙现象背后的本质。