飞蓬属植物叶绿体基因组比较分析揭示系统发育关系及进化动态

【字体: 时间:2025年10月11日 来源:BMC Plant Biology 4.8

编辑推荐:

  本研究针对飞蓬属(Erigeron)内长期存在的分类学争议,通过测序和/或从头组装16个飞蓬属物种的完整叶绿体(cp.)基因组,并与9个已报道物种进行比较分析。研究揭示了飞蓬属叶绿体基因组在长度(152,108–153,430 bp)、基因含量(112个独特基因)和结构上的高度保守性,同时鉴定出ycf2基因受到正选择,并发现psaC-ndhD等10个高多态性位点。系统发育分析表明传统分类中的Erigeron组和Trimorpha组并系,且原Conyza属物种嵌入飞蓬属内。该研究为飞蓬属的系统发育关系解析提供了可靠的分子标记,并深化了对菊科植物叶绿体基因组进化机制的理解。

  
在植物王国中,飞蓬属(Erigeron)是一个分布近乎世界性的庞大类群,约包含457种一年生、二年生或多年生草本植物,常被称为"fleabanes"。它们从北极-高山环境到受干扰的杂草景观中展现出卓越的生态适应能力。尽管其分布广泛,但飞蓬属内部的进化关系却异常复杂且难以解析。这主要归因于多系性、频繁的杂交以及持续存在的分类学挑战,尤其是在旧大陆物种中。历史上,Conyza属等类群被修订并并入飞蓬属,但这种处理并未被一致接受,许多东亚特有种(如著名的药用植物短葶飞蓬Erigeron breviscapus)甚至尚未被归入任何组中。这种分类上的模糊不清,呼唤着更强大的分子工具来揭示其真实的进化历史。
叶绿体(cp.)是进行光合作用的细胞器,拥有其独立的DNA。叶绿体基因组通常呈现保守的四分体结构,包括一个大单拷贝(LSC)区、一个小单拷贝(SSC)区和两个反向重复(IR)区。由于其母系遗传、缺乏减数分裂重组以及中等程度的多态性,叶绿体基因组已成为进化研究(包括系统发育学、群体遗传学、DNA条形码和保护研究)的宝贵工具。此前,仅有九个飞蓬属物种的叶绿体基因组被报道,且其中五项研究集中于智利胡安·费尔南德斯群岛的物种,缺乏对飞蓬属全球多样性的全面认知。
为了扩展基因组资源并更深入地了解飞蓬属叶绿体基因组的进化动态,研究人员开展了一项大规模的比较基因组学研究。本研究对Erigeron bonariensis进行了测序,并对另外15个已有原始测序数据的飞蓬属物种进行了叶绿体基因组的从头组装。结合从NCBI数据库获取的九个物种,研究人员对总共25个飞蓬属物种的叶绿体基因组进行了综合分析。这些物种涵盖了新世界、旧世界以及岛屿特有类群,生态范围从亚北极、高山到温带和热带地区,为进行详细而全面的比较基因组分析奠定了基础。该研究成果正式发表在《BMC Plant Biology》期刊上。
为开展本研究,作者们主要运用了几项关键技术:首先,利用Illumina NovaSeq 6000平台进行高通量测序,获取物种的原始基因组数据;其次,采用GetOrganelle软件进行叶绿体基因组的从头组装,这是一个高效且稳健的组装流程;接着,利用GeSeq和PGA等在线工具对组装好的基因组进行精确注释,包括基因、tRNA、rRNA的预测与验证;在比较分析中,应用Mauve进行基因共线性分析,使用IRscope和CPJSdraw可视化IR区的收缩与扩张,通过MAFFT进行多序列比对;对于进化分析,使用Ka/Ks Calculator计算非同义替换(Ka)和同义替换(Ks)的比率,并利用HyPhy软件包中的BUSTED和MEME模型检测正选择信号;此外,还使用MISA识别简单序列重复(SSR),利用CPStool计算核苷酸多样性(π)以筛选高多态性位点;最后,基于完成叶绿体基因组序列,使用IQ-TREE软件构建最大似然系统发育树,并通过超快自举法评估节点支持率。样本来源包括野外采集(如巴基斯坦的E. bonariensis)和从NCBI公共数据库获取的已有测序数据。
基因组测序和基因组的从头组装
研究人员对采自巴基斯坦的Erigeron bonariensis进行了测序,获得了约7.94 GB的数据,其叶绿体基因组的平均覆盖深度高达270x。此外,还成功地从公共数据库中对15个额外的飞蓬属物种的叶绿体基因组进行了从头组装,覆盖深度在38x至8356x之间,确保了组装结果的准确性。
叶绿体基因组特征的比较分析
研究发现,所有研究的飞蓬属物种的完整叶绿体基因组长度在152,108 bp (E. acris) 到153,430 bp (E. muirii) 之间,显示出高度的一致性。每个基因组都包含112个独特基因,包括79个蛋白质编码基因(CDS)、29个tRNA基因和4个rRNA基因。IR区重复了16个基因。基因的顺序和内容高度保守,共线性块分析(渐进Mauve比对)证实了这一点,未发现长的倒位现象。
内含子分析
基因组中的内含子含量也高度保守。共鉴定出18个含内含子的基因(12个蛋白质编码基因和6个tRNA基因),其在不同物种中的位置是保守的。蛋白质编码基因中,rps12的内含子长度最小且最保守(534 bp),而rpl16的变异最大(975至1164 bp)。最长的内含子出现在ndhA中(1066至1097 bp)。对于tRNA基因,最长的内含子出现在trnK-UUU中(2532-2544 bp),而最小的出现在trnL-UAA中(436-443 bp)。
反向重复区的收缩和扩张
对25个飞蓬属物种的分析揭示了四个连接处(LSC/IRb (JLB), IRb/SSC (JSB), SSC/IRa (JSA), and IRa/LSC (JLA))的IR边界位置存在微小变异。这些连接处的基因组织非常一致。JSB连接处总是包含一个功能性的ycf1基因,而其565-586 bp截短的假基因拷贝(ψycf1)始终出现在JSA处。ndhF基因完全位于SSC区内。在JLB处,rpl2基因始终位于LSC中距连接点116-144 bp的位置,而rps19跨越边界,在IRb中有62-89 bp,在LSC中有190-212 bp。这些保守的结构特征表明飞蓬属叶绿体基因组的IR边界维持受到强大的进化约束。
密码子使用、氨基酸频率、重复以及转换和颠换替换
所有飞蓬属物种在密码子使用模式、氨基酸频率和简单序列重复(SSR)方面都表现出高度的相似性。相对同义密码子使用(RSCU)分析表明,大多数氨基酸由以A或T结尾的密码子编码。亮氨酸是最常被编码的氨基酸,其次是异亮氨酸,而半胱氨酸是最不常被编码的。SSR分析显示,重复序列总数在75到97之间,其中单核苷酸SSR最丰富,其次是二核苷酸和三核苷酸SSR。
在替换类型方面,与转换替换相比,颠换替换的发生频率更高。在整个叶绿体基因组中,转换与颠换(Ts/Tv)的比率在0.73到0.90之间。大多数替换发生在LSC区,其次是SSC区,然后是IR区。
同义和非同义替换以及正选择评估
CDS的进化速率揭示这些基因受到强烈的纯化选择,平均Ka/Ks值为0.068。基于计算的Ka/Ks数据,没有基因受到正选择。正如所料,与光合作用相关的基因承受了最强的纯化选择压力。
一些基因显示出大于0.5的Ka/Ks值。这些基因使用BUSTED和MEME进行了进一步测试。对16个叶绿体CDS的BUSTED分析显示,有限的证据表明在飞蓬属物种中存在 episodic diversifying selection( episodic diversifying selection),只有ycf2显示出全基因范围正选择的统计学显著证据(p=0.0380)。MEME检测到五个基因(accD, ndhF, rbcL, ycf1, and ycf2)中特定密码子位点存在 episodic diversifying selection。
核苷酸多样性分析
对基因间隔区(IGS)、内含子区和蛋白质编码序列进行分析,以识别所有取样物种中的高变异区。当所有物种都包含在分析中时,整个叶绿体基因组的平均核苷酸多样性(π)为0.0038。基因间隔区表现出最高的平均多样性(π=0.0127),其次是内含子区(π=0.0032)和蛋白质编码序列(π=0.0023)。
鉴定出十个多态性位点作为群体遗传和系统地理学研究的潜在候选位点。这些位点包括psaC-ndhD (π=0.0314), ndhD-ccsA (0.0270), trnT-trnL (0.0226), psbI-trnS (0.0226), ndhI-ndhG (0.0195), clpP-psbB (0.0182), ccsA-trnL (0.0159), ycf1-rps15 (0.0154), trnD-trnY (0.0142), and ndhC-trnV (0.0134),其中psaC-ndhD变异最高。蛋白质编码序列通常多态性较低;然而,rps19 (π=0.0118), ycf1 (0.0075), rps15 (0.0051), and ndhF (0.0049)在编码区中显示出相对较高的多样性。
系统发育树重建
基于完整的叶绿体基因组序列,重建了25个飞蓬属物种的系统发育关系。结果显示,传统的组级分类(主要遵循Nesom的分类系统)存在并系现象。
具体来说,Erigeron组和Trimorpha组都表现出并系性。历史上被归类为Conyza属的物种(如E. bonariensis和E. canadensis)嵌入在飞蓬属的支系中,这为POWO(Plants of the World Online)将其合并入飞蓬属的处理提供了初步的 phylogenomic(系统发育基因组学)支持。来自智利胡安·费尔南德斯群岛的物种形成了一个单系群。中国的特有种短葶飞蓬(E. breviscapus)与来自亚洲和欧洲的Trimorpha组的物种聚在一起,表明其与该组存在潜在的亲缘关系。
本研究首次对25个飞蓬属物种的叶绿体基因组进行了全面的比较分析,揭示了其基因组结构的保守性以及局部区域的适应性进化。研究发现叶绿体基因组在大小、基因顺序和编码内容上高度保守,印证了其作为植物中缓慢进化的基因组组成部分的角色。同时,研究也检测到了一些细微的、谱系特异性的调整,例如trnT-GGU的假基因化。高度保守的IR边界和基因连接处结构强调了飞蓬属类群间密切的进化关系。
对正选择的评估表明,飞扑属叶绿体基因组的进化主要受纯化选择塑造,但偶尔也会在个别密码子上出现正选择的爆发。ycf2基因受到了全基因范围的正选择,而accD、ndhF、rbcL、ycf1和ycf2等基因的特定密码子则检测到位点特异性的 episodic diversifying selection( episodic diversifying selection)。这些发现支持了利用整合方法(Ka/Ks、BUSTED和MEME)来捕捉作用于细胞器基因组的全谱进化压力。
最重要的是,研究鉴定出了十个高度多态性的基因间隔区位点(如psaC-ndhD),这些位点为未来飞蓬属内的系统发育和群体遗传学研究提供了极有价值的分子标记。与之前基于较少物种(尤其是地理范围受限的物种)的研究相比,本次研究结果存在差异,这凸显了全面物种取样和一致分析方法对于识别可靠多态性位点的重要性。
系统发育分析结果挑战了飞蓬属传统的组级分类。Erigeron组和Trimorpha组均被揭示为并系群,表明当前的 sectional delimitations(组的划分)与基于叶绿体基因组的系统发育关系不一致。原Conyza属物种嵌入飞蓬属内,为POWO的广义飞蓬属概念提供了初步支持。然而,由于叶绿体基因组是单亲遗传的,且本研究取样有限,这些结论尚需谨慎对待。未来的研究需要结合更广泛的物种取样、核基因组数据以及形态学评估,来建立更稳健的分类框架。
综上所述,本研究极大地增进了我们对飞蓬属叶绿体基因组进化动力学的理解,为解析其复杂的系统发育关系提供了宝贵的基因组资源和强有力的分子工具。所识别的多态性位点有望成为未来研究的焦点,而所揭示的分类学复杂性则呼吁对该属进行进一步的系统修订。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号