四种胡卢巴属(Trigonella)植物的叶绿体基因组比较分析:结构重排、基因丢失与系统发育关系

《Frontiers in Plant Science》:Comparative chloroplast genome analysis of four Trigonella species: structural rearrangements, gene loss, and phylogenetic relationships

【字体: 时间:2026年06月11日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  豆科(Fabaceae)是叶绿体基因组进化中结构最具动态变化的植物科之一,特别是在倒位重复缺失分支(inverted repeat-lacking clade, IRLC)中,一个倒位重复的缺失使质体易于发生加速重排和基因丢失。在此,研究人员展示了四种胡卢巴属

  
豆科(Fabaceae)是叶绿体基因组进化中结构最具动态变化的植物科之一,特别是在倒位重复缺失分支(inverted repeat-lacking clade, IRLC)中,一个倒位重复的缺失使质体易于发生加速重排和基因丢失。在此,研究人员展示了四种胡卢巴属(Trigonella)物种(T. foenum-graecum、T. corniculata、T. caerulea和T. gladiata)的完整叶绿体基因组,并对其质体进化和系统发育关系进行了全面的比较分析。所有四个基因组大小在124,823至125,437 bp之间,每个编码77个蛋白质编码基因、30个tRNA基因和4个rRNA基因。三个基因(infA、rpl22和rps16)在一个或多个物种中保留为伪基因,捕获了正在进行的质体到核基因转移的不同阶段。全基因组比对揭示了T. foenum-graecum质体中复杂的结构重排,涉及约35.5 kb区域内四个局部共线性区块的倒位和易位,这种模式在三个共线性物种中不存在。大多数蛋白质编码基因受到强纯化选择;五个基因(clpP、ycf2、cemA、ycf1和rpl20)的Ka/Ks > 1,但只有clpP达到统计学显著性。核苷酸多样性分析确定clpP为最可变的编码序列,ycf2–trnI-CAU间隔区、trnR-UCU–atpA和rps15–ycf1为最可变的基因间区。简单序列重复(SSR)分析鉴定了101个多态性位点及其相关引物对,为群体水平研究提供了资源。系统发育分析证实胡卢巴属(Trigonella)不是一个自然类群,T. corniculata解析为与草木犀属(Melilotus)的M. albus和M. officinalis互为姐妹群,且具有最大自展支持,为该属的正式分类修订提供了强有力的证据。
论文解读文章

**研究背景**
豆科(Fabaceae)是叶绿体基因组进化中结构最具动态变化的植物科之一,尤其是在倒位重复缺失分支(inverted repeat-lacking clade, IRLC)中,一个倒位重复的缺失使质体容易发生加速的结构重排和基因丢失。胡卢巴属(Trigonella)属于IRLC内的车轴草族(Trifolieae),与草木犀属(Melilotus)和苜蓿属(Medicago)的分类关系长期存在争议。此前基于核和质体标记的系统发育研究显示,Trigonella作为一个属并非自然类群(即多系或并系),Melilotus实际上嵌套在Trigonella内部。然而,缺少跨越多物种的完整叶绿体基因组比较分析,限制了对其结构进化、基因丢失模式以及Trigonella与Melilotus间系统发育关系的深入理解。为此,研究人员对四种Trigonella物种——T. foenum-graecum、T. corniculata、T. caerulea和T. gladiata——进行了完整的叶绿体基因组测序和比较分析,旨在描述质体结构、鉴定核苷酸变异和选择压力、并利用全质体系统发育澄清属间关系。该论文发表在《Frontiers in Plant Science》。

**关键技术与方法**
研究人员首先对T. corniculata cv. Pusa Kasuri Mathi和T. foenum-graecum cv. AFG-3的种子培养后提取基因组DNA,利用Illumina NovaSeq 6000平台进行双端测序;T. caerulea和T. gladiata的叶绿体基因组则从NCBI序列读段档案(SRA)中公开的基因组测序数据(BioProject PRJEB82787,由法国国家测序中心Genoscope提供)进行组装。使用CGAS v1.0.1(调用GetOrganelle v1.7.2)进行从头组装,并用GeSeq v2.03和PGA进行注释。全基因组比对采用Mauve的progressiveMauve算法和mVISTA的Shuffle-LAGAN模式。简单序列重复(SSR)检测使用MISA Perl Script v2.1。选择压力分析通过Ka/Ks比值评估,核苷酸多样性(π)用DnaSP 6计算。系统发育分析基于64个共有蛋白质编码基因的串联序列,使用RAxML v8.2.12进行最大似然法推断,并设置1000次自展检验。

**研究结果**

**胡卢巴属叶绿体基因组的一般特征**
四种Trigonella物种的叶绿体基因组大小高度保守,范围为124,823–125,437 bp,GC含量约34%,每个基因组编码77个功能蛋白质编码基因、30个tRNA基因和4个rRNA基因。此外,三个基因(infA、rpl22和rps16)在不同物种中保留为截短的非功能残基(伪基因):infA仅在T. caerulea中编码21个氨基酸;rpl22在T. caerulea、T. corniculata和T. gladiata中编码32–40个氨基酸;rps16在T. caerulea和T. gladiata中存在提前终止密码子。这些结果表明这三个基因在四种Trigonella的叶绿体基因组中均为伪基因。

**胡卢巴属叶绿体基因组的结构组织**
通过全基因组比对(Mauve)发现,T. caerulea、T. corniculata和T. gladiata的局部共线性区块(LCB)几乎完全共线性,而T. foenum-graecum相对于其他三种物种呈现复杂的结构重排:四个LCB(跨越约35.5 kb)发生倒位或易位。例如,LCB D在T. corniculata中位于46,425–65,041 bp,在T. foenum-graecum中反向定位于25,709–44,602 bp;LCB B也反向易位。mVISTA序列一致性分析显示,四个基因组在蛋白质编码外显子区域高度保守(如rbcL、matK、psbA等),非编码间隔区则差异更显著。

**胡卢巴属叶绿体基因组中的简单序列重复**
共鉴定出433个简单序列重复(SSR),每个基因组106–110个,密度约0.85–0.88 SSR/kb。SSR主要由单核苷酸(57.8–66.4%)和二核苷酸(27.8–38.5%)重复组成,其中poly-A重复占所有SSR的61.9%。比较分析发现了101个多态性位点(51个仅存在/缺失变异,12个仅长度变异,38个两者兼具),并设计了101对引物,为群体水平的基因分型和物种鉴别提供了实用资源。

**蛋白质编码基因的选择压力分析**
对所有共享蛋白质编码基因的Ka/Ks比值(ω)分析显示,绝大多数基因受强纯化选择:43个基因(62.3%)平均Ka/Ks < 0.2,其中18个基因Ka/Ks = 0(氨基酸完全保守)。五个基因的Ka/Ks > 1,提示正选择:clpP(1.258)、ycf2(1.126)、cemA(1.078)、ycf1(1.074)和rpl20(1.062),但只有clpP达到统计学显著性(p = 0.0014),与它在被子植物中叶绿体基因组加速进化的已知历史一致。

**核苷酸多样性分析**
对110个基因位点和78个基因间隔区(IGS)的核苷酸多样性(π)调查显示,tRNA和rRNA基因几乎不变(π = 0),蛋白质编码基因中clpP的π值最高(0.0975),其次是ycf1(0.0443)、accD(0.0376)和ycf2(0.0330),而核心光合亚基基因(如psbA、psaA、psaB、rbcL)几乎不变(π < 0.01)。IGS区域整体变异更大,其中ycf2–trnI-CAU间隔区π值最高(0.1468),其次为trnR-UCU–atpA(0.0750)和rps15–ycf1(0.0614)。

**密码子使用与氨基酸组成**
相对同义密码子使用度(RSCU)分析表明,四个物种均强烈偏好以腺嘌呤(A)或胸腺嘧啶(T)结尾的密码子(如TTA亮氨酸、GCT丙氨酸),而胞嘧啶(C)或鸟嘌呤(G)结尾的密码子(如TCG、CCG、ACG)普遍低用。亮氨酸是最丰富的氨基酸(10.63%),其次为异亮氨酸(8.98%)、丝氨酸(7.55%)等,反映了AT偏向的密码子使用模式。

**系统发育分析**
基于64个共有蛋白质编码基因的串联序列进行最大似然系统发育分析(包括IRLC内44个类群及外类群Phaseolus vulgaris和P. lunatus),结果将四种Trigonella置于IRLC分支内。T. caerulea、T. gladiata和T. foenum-graecum形成高支持单系群,而T. corniculata与Melilotus albus和M. officinalis互为姐妹群(自展支持100%),证实了Trigonella相对于Melilotus的并系性。Trigonella–Melilotus分支与Medicago姊妹,并与Trifolium共同构成核心车轴草族,然后与野豌豆–兵豆–山黧豆(Vicia-Lens–Lathyrus)联盟形成姐妹关系,所有节点均获得完全自展支持。

**讨论与结论**
讨论部分指出:四种Trigonella叶绿体基因组的大小和GC含量与其他IRLC豆类一致;infA、rpl22、rps16的伪基因状态反映了正在进行的内共生基因转移(endosymbiotic gene transfer, EGT)过程,在相关豆类中已发现这些基因的核编码功能替代(如蒺藜苜蓿Medicago truncatula的rps16核拷贝来源于线粒体基因组)。IR缺失导致的结构不稳定性可能促进了这些基因丢失和大规模重排——T. foenum-graecum中约35.5 kb区域的倒位和易位即为新证据。SSR多态性标记和高度可变的基因间隔区为群体遗传学和谱系地理研究提供了实用工具。选择压力分析确认纯化选择主导质体进化,而clpP的高Ka/Ks值和核苷酸多样性使其成为被子植物中的一个持续异常值。系统发育分析以最高支持强度证实了Trigonella的并系性,强烈支持对该属进行正式分类修订。

**结论部分翻译**:本研究呈现了四种胡卢巴属(Trigonella)物种(T. foenum-graecum、T. corniculata、T. caerulea和T. gladiata)的首次比较叶绿体基因组分析。尽管在基因组大小、基因含量和核苷酸组成上广泛保守,且均与其他IRLC豆类一致,但仍发现若干进化上有意义的发现。infA、rpl22和rps16在一个或多个物种中的伪基因状态捕获了正在进行的质体到核基因转移的不同阶段,强化了IRLC代表内共生基因组减少的自然实验的观点。全基因组比对显示,T. foenum-graecum的基因组组织与三个共线性物种不同,通过一系列影响四个局部共线性区块的倒位和易位,导致约35.5 kb区域内的基因顺序重组。选择压力分析确认纯化选择主导质体进化,而clpP的高Ka/Ks和核苷酸多样性使其成为被子植物中的一个持续异常值。所有四个质体的密码子使用主要受选择而非突变偏倚塑造,这一模式在光合质体基因组中已有充分记载。本研究鉴定的多态性SSR位点和超可变基因间隔区为属内群体遗传学和谱系地理研究提供了实用资源。最关键的是,全质体系统发育分析提供了迄今最强有力的证据,表明当前定义的Trigonella不是一个自然类群,T. corniculata以最大自展支持解析为Melilotus(M. albus和M. officinalis)的姊妹群。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号