揭秘鳞翅目早期进化:新基因如何塑造万千蛾蝶?

【字体: 时间:2025年02月20日 来源:BMC Genomics 3.5

编辑推荐:

  为探究鳞翅目早期进化中基因的作用,牛津大学研究人员开展相关研究。他们发现众多新基因家族,如糖转运蛋白和螺旋桨蛋白基因家族。这为理解鳞翅目进化提供新视角,强烈推荐科研读者阅读。

  
在奇妙的昆虫世界里,鳞翅目昆虫(Lepidoptera)可是个大家族,蛾子和蝴蝶都属于这个家族,它们的种类繁多,差不多占了已知动物物种的 10% 呢!这些小家伙们形态各异、习性多样,有的喜欢在花丛中翩翩起舞,吸食花蜜;有的则在夜晚穿梭,寻找合适的食物和栖息地。它们如此丰富的多样性是怎么来的呢?这可让科学家们好奇极了。

以往的研究发现,遗传变化对生物的多样化和适应起着关键作用。但要找出那些隐藏在生物体表型变化背后的基因组驱动因素,可不是一件容易的事。很多科学家尝试从物种内部的表型多态性,或者近缘物种之间的差异入手,再利用基因组和实验方法去寻找背后的致病突变。有的研究发现非编码 DNA 的序列变化会影响保守基因的表达;还有的发现编码序列的变化会导致氨基酸替换或者功能丧失,这些变化在自然选择下被固定了下来。然而,现有的基因变化并不能解释所有的适应性进化。

在比较基因组学的研究中,科学家们发现基因数量的变化、基因重复以及新基因的产生,对生物的进化和适应有着重要作用。新基因,简单来说,就是那些在特定生物类群中特有的蛋白质编码基因,在其他类群里找不到它们的近亲。这些新基因的起源方式多种多样,可能是基因重复后发生了很大的序列变化,也可能是不同基因位点融合、转座元件插入,或者是通过水平基因转移(Horizontal Gene Transfer,HGT)从其他物种获得,甚至有可能是从非编码 DNA 中全新产生的。在节肢动物里,就有很多例子。比如,有些昆虫从细菌那里获得了水平转移的基因,这些基因帮助它们适应了植食性生活,还有的影响了蛾子和蝴蝶的雄性求偶行为。

为了弄清楚新基因在鳞翅目昆虫早期进化中扮演着怎样的角色,来自英国牛津大学(University of Oxford)的 Asia E. Hoile、Peter W. H. Holland 和 Peter O. Mulhair 等研究人员,在《BMC Genomics》期刊上发表了一篇名为 “Gene novelty and gene family expansion in the early evolution of Lepidoptera” 的论文。他们通过研究发现,在鳞翅目昆虫进化的早期,出现了许多新的基因家族。其中,有两个基因家族特别引人注目,一个编码糖和离子转运蛋白分子,另一个编码一种特殊的螺旋桨状蛋白质,它们在鳞翅目昆虫的生物学特性中可能起着非常重要的作用。这项研究为我们理解鳞翅目昆虫的进化提供了新的视角,让我们更清楚地认识到基因在这个过程中的重要作用。

研究人员在这项研究中用到了好几种关键技术方法。他们从 Ensembl Rapid Release 数据库获取了 99 种鳞翅目昆虫和 16 种其他节肢动物的蛋白质组数据,然后用 Orthofinder 软件构建基因家族,找到新基因。为了构建物种树,他们先把从 Orthofinder 输出结果里得到的 25 个单拷贝直系同源物的氨基酸序列,用 MAFFT 软件进行比对,再用 trimAl 软件修剪,最后用 PhyKIT 软件进行拼接,用 IQ-TREE 软件构建物种树。他们还用 BLASTp 搜索等方法来分析基因家族的起源和进化,通过 RNA-seq 数据和相关软件来量化基因表达,利用基因共线性分析来研究基因的同源性。

下面咱们来详细看看他们都有哪些有趣的研究结果吧。

鳞翅目基部出现的新基因


研究人员先从 115 个物种(包括 99 种鳞翅目昆虫和 16 个外群物种)的 25 个单拷贝基因构建了一个系统发育树。这个树和之前大家推测的进化关系基本一致,比如 Micropterigidae 科(在研究数据集中有 Micropterix aruncella 和 Neomicropterix facetella)位于其他鳞翅目谱系的姐妹群位置,还能看到像 Ditrysia、Apoditrysia 和 Macroheterocera 这些大的分类群,而且数据集中所有分类科的单系群都能恢复。

接着,研究人员用 OrthoFinder 软件构建同源基因组,筛选出在进化早期出现的新基因或新基因家族。他们把那些在一个进化分支里存在,但在外群物种里没有的同源基因组定义为新基因家族。经过筛选,他们发现了 217 个可能起源于鳞翅目分支的新基因家族。进一步分析这些基因家族的起源方式,发现大多数(177 个同源基因组)可能是通过基因重复,然后发生了广泛的序列分化产生的;只有 2 个可能是通过水平基因转移来的;还有 38 个可能是孤儿基因,也就是可能通过从头基因起源产生的,但这还需要更多研究来证实。他们还在 Ditrysia 分支上发现了 541 个新的同源基因组,其中 398 个可能源于基因重复,13 个通过水平基因转移,130 个可能是从头起源的。

研究人员猜测,对鳞翅目生物学特别重要的新基因,在大多数鳞翅目物种里都应该存在,而且在基因出现后很少丢失。于是,他们计算了每个起源于鳞翅目节点的同源基因组的基因拷贝数,并绘制了热图。结果发现,217 个同源基因组里大约一半在系统发育树上的分布比较分散,可能是经常丢失,或者在鳞翅目内序列分化太大,不好确定同源关系。有 87 个同源基因组存在于 75% 以上的鳞翅目物种里,偶尔会有基因丢失和重复。通过进一步分析,他们还发现有两个同源基因组(OG0000164 和 OG0000175)的基因拷贝数和平均值差异很大,这两个基因组在所有分析的鳞翅目物种里都存在,而且拷贝数变化很大,说明它们在鳞翅目内经历了广泛的基因重复。

鳞翅目糖和溶质转运蛋白的基因扩张


在所有起源于鳞翅目节点的同源基因组里,平均拷贝数最高的是一个糖转运蛋白基因家族(OG0000164)。在不同的物种里,这个基因家族的拷贝数变化很大,少的像 Micropterix aruncella 只有 1 个基因,多的像 Manduca sexta 有 12 个基因。因为动物体内的糖转运蛋白超家族又大又多样,为了弄清楚这个鳞翅目特有的同源基因组有什么意义,研究人员扩大了分析范围,把所有含有糖转运蛋白结构域的同源基因组都考虑进来。结果发现,数据集中有 99 个同源基因组含有糖转运蛋白结构域,其中 9 个是在鳞翅目或 Ditrysia 节点出现的。这 9 个同源基因组在不同物种里的拷贝数变化也不一样,有的是单拷贝,有的经历了广泛的基因重复。

为了搞清楚这 9 个含有糖转运蛋白的同源基因组是有一个共同的进化起源,还是从不同的祖先糖转运蛋白基因独立进化来的,研究人员构建了一个系统发育树。结果发现,鳞翅目和 Ditrysia 特有的糖转运蛋白基因似乎有多个起源,但不是每个同源基因组都独立起源。比如,两个起源于鳞翅目的同源基因组(OG0000164 和 OG0008208),还有两个起源于 Ditrysia 的同源基因组(OG0008344 和 OG0000540)在系统发育树上靠得很近。另一个同源基因组(OG0008400)虽然在这个分支外面,但它们都属于溶质载体 2(Solute Carrier 2,SLC2)家族。还有 4 个糖转运蛋白同源基因组属于 SLC22 蛋白亚家族,它们都是 Ditrysia 特有的。

研究人员还发现,在系统发育树上靠得很近的 4 个 SLC2 样同源基因组,在基因组上的位置也很接近,在很多不同的鳞翅目物种里都紧密相连,这说明它们可能起源于鳞翅目基部的一次祖先基因重复事件,然后在祖先鳞翅目和 Ditrysia 分支上又发生了串联重复。而 SLC22 样同源基因组在基因组上的分布比较分散,如果它们起源于同一个祖先基因,那应该是在重复后分散到了基因组的不同位置。

为了探究这些鳞翅目物种转运蛋白基因家族的功能,研究人员分析了家蚕(Bombyx mori)多个时间点和组织的表达模式。结果发现,这 9 个基因家族的所有基因在至少一个组织或发育阶段都有表达,丝腺是最常表达的部位,但有些基因的表达范围很广。

鳞翅目螺旋桨蛋白基因通过水平基因转移产生


另一个在鳞翅目基部出现,而且在所有分析的蝴蝶和蛾子物种里都有很高拷贝数的基因家族是 OG0000175。这个家族的基因以前在昆虫里还没有被描述过,研究人员发现它们编码的蛋白质有 β - 螺旋桨结构,所以把这个基因家族命名为螺旋桨蛋白(propellin)基因家族。这个基因家族很特别,在鳞翅目里很保守,但和研究的外群节肢动物里的任何同源基因组都没有可检测到的序列相似性。而且,通过进一步搜索,研究人员发现鳞翅目里不止 OG000175 这一组螺旋桨蛋白基因,它们被分成了 8 个不同的同源基因组,都只存在于鳞翅目里。把所有螺旋桨蛋白同源基因组加起来,鳞翅目基因组平均有 11 个基因拷贝,不同物种之间拷贝数也有差异。

为了弄清楚螺旋桨蛋白基因在鳞翅目里的起源,研究人员用 OG0000175 里的所有蛋白质,在 NCBI 非冗余蛋白质数据库(不包括鳞翅目序列)里进行 BLASTp 搜索,结果发现和细菌物种的蛋白质有显著的序列相似性,其中匹配最多的细菌属是 Spiroplasma,还有一些匹配到 Macrococcus 和 Escherichia。通过多次迭代搜索,发现除了细菌,和其他物种的匹配很少。构建系统发育树后发现,所有鳞翅目螺旋桨蛋白序列在基因树里都很相近,和它们关系最近的分支是 Spiroplasma 序列,这表明可能发生了从细菌到鳞翅目的水平基因转移。虽然鳞翅目和 Spiroplasma 的序列相似性不高,但预测的蛋白质 3D 结构显示,它们都有 6 叶螺旋桨结构,这进一步证明了它们的同源关系。

研究人员还对高拷贝数的螺旋桨蛋白同源基因组(OG0000175)进行了更深入的进化分析。系统发育分析把这个同源基因组在鳞翅目里分成了 6 个分支,也就是基因亚家族。早期分化的 Micropterigidae 科在进化树的第 1 个分支里有一个螺旋桨蛋白基因。研究人员还研究了这 6 个亚家族在不同鳞翅目物种里的局部基因共线性,发现除了第 4 个分支,每个亚家族的基因都和一些同源的 “标记基因” 形成微共线性簇,这说明这 6 个螺旋桨蛋白亚家族在鳞翅目里是一对一的直系同源基因。而且,很多标记基因在节肢动物外群里也存在于微共线性模块里,这表明这里可能是鳞翅目特有的螺旋桨蛋白基因整合进基因组的位点。研究人员推测,这个同源基因组可能是通过一次从 Spiroplasma 或其他细菌来源的水平基因转移事件进入鳞翅目,然后在基因组里发生重复和转座。

研究人员还用转录组数据集分析了家蚕、君主斑蝶(Danaus plexippus)和金凤蝶(Papilio machaon)中所有螺旋桨蛋白基因的表达情况。结果发现,每个物种里所有基因拷贝都有表达,但表达模式很复杂,不同物种之间和物种内部都有差异。比如,君主斑蝶的大多数螺旋桨蛋白基因拷贝在幼虫或蛹期有表达,但在成虫期表达量最高,在胸部的表达尤其高;金凤蝶的大多数拷贝只在一两个生命阶段表达,而有些则在整个生命周期都有很强的表达;家蚕的表达则覆盖了更多的生命阶段和组织类型,但在中肠和丝腺里表达很少或没有表达。虽然不同物种里同源拷贝的表达相关性不大,但多个物种在不同生命阶段和组织里都有表达,这说明这些基因在很多鳞翅目物种里都有功能。

研究人员还发现,除了细菌和鳞翅目,在双翅目(Diptera)的一种真菌蚋(Bradysia coprophila)里也有一个可能同源的基因。他们推测这个双翅目基因可能是通过一次独立的水平基因转移从 Spiroplasma 获得的,而且这个真菌蚋可能还通过水平基因转移获得了其他基因。

在讨论部分,研究人员也提到,虽然他们鉴定出了鳞翅目进化谱系上出现的新基因,但这个数量并不能完全准确地衡量基因组的新颖性。因为新基因的定义比较实用,包含了多种起源方式,而且序列分化参数的改变可能会影响基因数量的计算。同时,基因组注释不完整可能会少算新基因,而一些因素又可能导致多算新基因。不过,他们的分析让我们第一次了解到了鳞翅目出现过程中不同基因起源方式的相对重要性。

研究中发现的螺旋桨蛋白基因家族,可能是通过水平基因转移从 Spiroplasma 细菌获得的,然后在鳞翅目里大量重复。虽然现在还不清楚它在鳞翅目生物学里的确切功能,但它在进化过程中一直保留下来,而且细菌里的同源基因有很多不同的功能,这说明这个基因家族可能对蛾子和蝴蝶的生物学特性很重要。

另一个编码 SLC2 样糖转运蛋白的基因家族,在其他动物里和糖转运有关。在鳞翅目早期进化中,它们和糖摄食的生态关联发生了很大变化。虽然这个基因家族在以花粉为食的 Micropterigidae 科里就存在,但直到以花蜜为食的 Ditrysia 进化出来,才出现了大量的基因重复、广泛的基因保留和新的 SLC 样糖转运蛋白基因家族。这表明新的糖转运蛋白基因家族在鳞翅目基部就出现了,但大规模的基因重复和功能分化是在后来和花蜜摄食相关的进化过程中发生的,不过这些遗传变化和新摄食行为进化之间的因果关系还需要进一步研究。

总的来说,这项研究意义重大。它让我们看到了在鳞翅目昆虫进化的早期,有 217 个新基因家族出现在通往鳞翅目的节点上,541 个新基因家族出现在通往 Ditrysia 的节点上。其中两个基因家族特别值得关注,一个可能起源于细菌的水平基因转移,然后产生了多样的螺旋桨蛋白基因;另一个编码糖转运蛋白,在早期进化中大量重复和分化。这些发现为我们理解鳞翅目昆虫的进化提供了全新的视角,让我们对基因在物种进化过程中的作用有了更深刻的认识,也为后续进一步研究鳞翅目昆虫的生物学特性和进化历程打下了坚实的基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号