综述:植物MITEs:具有重大影响的微型转座元件

《Mobile DNA》:Plant MITEs: miniature transposable elements with major impacts

【字体: 时间:2025年11月09日 来源:Mobile DNA 3.1

编辑推荐:

  这篇综述系统阐述了植物微型反向重复转座元件(MITEs)的发现、特征、转座机制及其对基因表达和表型多样性的深远影响。文章指出,MITEs通过携带转录因子结合位点(TFBS)、产生小RNA(siRNA/miRNA)、诱导DNA甲基化和介导结构变异等多种分子机制,在植物基因组进化、环境适应性及重要农艺性状形成中扮演关键角色,为作物育种提供了新视角。

  
MITE发现
微型反向重复转座元件(MITEs)最初由Susan Wessler在20世纪80年代研究玉米蜡质(Wx)基因突变体时发现。在wxB2等位基因中,一个128 bp的小插入导致了一种新的转座元件Tourist的识别。随后,在高粱磷酸烯醇式丙酮酸羧化酶基因中发现的Tourist-Sb5内部的257 bp插入,又导致了Stowaway元件的鉴定。自此,MITEs在动植物基因组中被广泛识别。大多数植物MITEs可分为两大类:源自PIF/Harbinger的Tourist-like MITEs和源自Tc1/Mariner的Stowaway-like MITEs。此外,MITEs也可源自其他II类转座元件家族,如CACTA、hAT和Mutator。
MITE特征
尽管Tourist和Stowaway超家族没有序列相似性,但它们具有显著的结构相似性,即都携带末端反向重复序列(TIRs)。Tourist和Stowaway MITEs的靶位点偏好不同(Stowaway偏好TA,Tourist偏好TWA),这反映了相应转座酶的偏好。MITE插入会产生短的(2-9 bp)A-T富集靶位点重复序列(TSDs)。计算生物学已识别出数百个MITE超家族。总之,虽然定义MITE没有明确标准,但它们共享一些区别于其他非自主II类转座元件的特征,如图1所列。
转座模式
由于其尺寸小,MITEs缺乏蛋白质编码序列。它们的TIRs可以被相关的转座酶反式识别以进行 mobilization。例如,Tourist mPing家族与全长转座元件具有序列相似性,表明它们源自这些元件的内部缺失。这些拷贝保留了其末端反向重复序列(TIRs),使其能够结合并由全长元件编码的转座酶 mobilise。例如,PIF/Harbinger元件需要两种蛋白质:用于DNA结合的ORF1和用于转座的含DDE/D结构域的转座酶。相比之下,Stowaway转座子的自主伙伴直到Wessler实验室在酵母中进行切除实验才被确定。最近,在酵母中对Tourist-like mPing及其相关自主元件Ping和Pong的内部序列进行系统性突变,发现了多个增强或抑制转座活性的区域。修改mPing的TIRs会严重降低转座频率,表明每个核苷酸对有效转座酶结合至关重要。此外,内部序列的系统性突变鉴定出几个同样促进或抑制转座的区域,表明MITEs内部的区域与TIRs协同作用,对调节转座速率以促进或自我限制其活性起着关键作用。MITEs的转座模式可能更为复杂,正如最近Pulido和Casacuberta所暗示的。事实上,在水稻中,基因组中存在某些特定MITE拷贝与其相应家族总拷贝数之间存在正相关,这表明可能只有少数“主”拷贝负责MITE家族的显著扩增。
MITE的影响
MITEs通过优先在基因附近或内部插入,能够强烈影响基因表达,从而影响其转录调控。MITEs在基因组进化、产生遗传多样性以及参与基因和调控元件重排中扮演关键角色。由于其高度丰度和多态性,MITEs在物种、群体甚至体细胞水平上促进多样性。这种遗传多样性由自然选择和遗传漂变等进化力量塑造,并可产生新的表型性状和适应性。理解MITEs的作用及其在表型变异和适应过程中的参与,可以为植物基因组的进化动力学提供有价值的见解。
MITEs在基因附近插入
与许多转座元件不同,MITEs表现出优先插入基因富集区域的特性。这或许可以解释MITEs在不同植物物种中对基因调控的广泛贡献。
在十字花科植物中,Tourist-like MITE Monkey King(在芸薹属中有504个完整拷贝,在拟南芥中有55个,在拟南芥中有38个)的大部分拷贝插入在基因3 kb范围内。该家族在十字花科物种内和物种间表现出高水平的转座元件插入多态性(TIPs)。在甘蓝型油菜中,4个种质中鉴定出677个TIPs,其中10个与附近基因的表达相关。对拟南芥19个种质的比较分析鉴定出343,485个MITE序列。在参考基因组中,有5,712个MITE插入位于注释基因附近(基因内或距离基因<40 bp),在所有19个种质中共有8,390个插入。常染色体MITEs插入靠近基因的内含子或最后的外显子,表明它们可能在这些基因的3'非翻译区(UTR)发挥调控作用。
在水稻中,MITEs对基因表达的影响更为广泛,在日本晴品种中与23,623个基因(58.2%)相关,这些插入位于内含子或调控区域。有7,887个MITE序列被转录,至少有3,463个与基因共转录。对属于籼稻和粳稻亚种的208个品种进行分析,发现了45,050个转座元件多态性(TIPs),主要对应于DNA转座子,尤其是MITEs。许多与TIPs相关的基因似乎与水稻驯化和育种有关。
类似地,在31个栽培和野生胡萝卜物种的基因组中发现了约18,500个Stowaway元件的多态性插入位点。在这些插入中,只有两个在所有31个基因组中都具有相同的元件插入。这些元件主要位于基因附近,特别是在基因侧翼2 kb区域以及5'和3' UTRs内,暗示其潜在的功能影响。此外,DcSto7b家族在栽培胡萝卜基因组中表现出更高水平的多态性,表明DcSto7b可能在胡萝卜驯化过程中活跃过。
MITEs对基因表达的功能性影响
MITEs可以插入基因启动子,从而调节其转录活性。例如,水稻的全基因组分析表明,与MITEs相关的基因往往比远离MITEs的基因表达水平显著降低。一些功能性影响的具体示例如下所述。
在蒲公英中,PAR(单性生殖相关区域)基因座是控制无融合生殖和有性生殖的主要数量性状基因座(QTL)。负责无融合生殖的显性等位基因包含一个保守的1,335 bp hAT MITE插入,该插入位于PAR基因座上游110 bp处,并诱导PAR基因表达。将含有此MITE的PAR等位基因导入莴苣卵细胞中,可在无需受精的情况下触发无融合生殖(图2A)。有趣的是,在山柳菊的无融合生殖变体中,也在其与蒲公英PAR基因座同源的LOP基因座上游137 bp处鉴定到一个1,282 bp的MITE插入。这表明这些物种的生殖性状可能是在MITEs驱动下平行进化的。
根系构型在植物发育和抵御逆境胁迫能力中起着关键作用。在一些小麦品种(如Drysdale)中,全基因组关联分析(GWAS)鉴定出一个与孕穗期根深相关的多态性125 bp Tc1/Mariner MITE插入。该插入位于TaVSR1-B基因的启动子区域内,导致其表达被抑制,可能通过DNA甲基化和H3K27三甲基化进行表观遗传沉默。此外,在转基因株系中过表达该基因与根伸长区减少和分化区扩大相关。
一项水稻GWAS分析将HTG3鉴定为与耐热性相关的候选基因,尤其是在日本晴、ZH11和MH63品种中。在热胁迫条件下,HTG3通过热休克蛋白和茉莉酸信号通路作为耐热性的正调控因子。HTG3有两种等位基因形式,最显著的差异是是否存在一个228 bp的MITE插入。缺乏MITE插入的等位基因在正常和热胁迫条件下均比含MITE插入的等位基因表现出更高的HTG3表达。在HGT3启动子区域,含插入等位基因与高甲基化相关,暗示可能通过甲基化进行抑制。
在柑橘物种(包括甜橙、温州蜜柑)中,体细胞胚发生组织中基因表达增加是多胚现象的主要原因。一个关键基因CitRKD1主要在多胚变体的生殖组织中表达。该基因有两种等位形式:(1)CitRKD1-mg2,一个上游有MITE插入的多胚等位基因;(2)CitRKD1-mg1,一个缺乏该插入的单胚等位基因。CitRKD1-mg2等位基因是多胚系珠心细胞体细胞胚发生中的主要转录本。此外,在甜橙中丧失CitRKD1功能会导致体细胞胚发生能力丧失,表明MITE插入可能参与CitRKD1在体细胞胚发生过程中的表达。
MITEs含有转录因子结合位点
MITEs序列内可携带转录因子结合位点(TFBSs),当它们插入到响应基因附近时,有潜力将新基因重新连接到已有的转录网络中。这可以通过不同的机制导致细胞调控格局的改变,如下列实例所示。
在十字花科物种中,转座元件导致了E2F TFBS基序的显著扩增。值得注意的是,约85%的这些基序位于转座元件内,主要存在于属于hAT、PIF/Harbinger和MULE超家族以及Helitrons的MITE拷贝中。这些10 bp的基序具有与E2Fa结合的能力,因此可能影响基因调控机制。然而,MITEs内发现的大多数E2F TFBSs位于远离基因的位置,可能稀释E2F转录因子。在拟南芥中,MITE编码的E2F TFBSs位于基因附近,并在不同生态型间表现出多态性,暗示其在适应中可能发挥作用。
类似地,在李属和番茄物种中,MITEs促进了与几种转录因子相关的TFBS基序的扩增(图2B)。含有bZIP60和PIF3(在李属中)以及TCP15/23(在番茄中)等因子TFBS位点的MITE拷贝的扩增,促进了此类基序的重新分布,在生物和非生物胁迫响应调控中扮演关键角色。例如,含bZIP60 TFBS的MITEs在李属物种间被动员和传播的方式不同;由此产生的基因网络差异很大,表明它们可能在杏和桃等物种中经历了不同的进化。
对玉米幼苗和苞叶组织中连接转录因子与靶基因的调控网络进行比较分析发现,苞叶特异性增强子似乎富含PIF/Harbinger MITEs。此外,位于苞叶特异性增强子中的那些MITEs富含特定的转录因子结合位点(TFBS)基序:HB-like、MYB-like和MADS box。有趣的是,由这些MITEs携带的MYB-like基序靶向的基因在叶片发育功能上富集,指明了这些MITEs在塑造玉米发育过程中基因表达时空调控方面的潜在作用。
MITEs影响小RNA的产生
由邻近基因启动子产生的MITE转录本,由于其TIRs可形成发夹二级结构。这些双链RNA(dsRNA)可作为产生24-nt小干扰RNA(siRNAs)的底物。MITEs也可以进化成microRNA(miRNA)和环状RNA(circRNA)的前体,从而影响基因表达模式。近期通过产生siRNA、miRNA和circRNA进行基因调控的研究总结如下。
在拟南芥Col-0生态型中,885个反向重复序列(IRs)中有634个位于基因3 kb范围内。值得注意的是,约68%的这些IRs可能源自转座元件(TEs),特别是MuDR家族的MITEs,并且约486个(634个IRs中的)产生24-nt小干扰RNA(siRNAs)。在无法产生24-nt siRNAs的突变体以及CHH甲基化受损的突变体中,这些IRs表现出DNA甲基化降低。IR触发甲基化的变异影响染色质拓扑结构,证明甲基化影响染色质环的形成。此外,位于基因附近的634个IRs中有193个在216个拟南芥生态型中表现出自然变异,表明这些变异可能影响染色质结构和基因活性。
在向日葵中,一个位于HaWRKY6基因上游600 bp处的260 bp MITE插入被确定与该基因相互作用,并在调节3D染色质构象中发挥关键作用(图2C)。源自该MITE的转录本导致24-nt siRNAs的产生。在叶片中,一个涉及调控区域和部分HaWRKY6基因序列的稳定环构象起到抑制HaWRKY6基因表达的作用。相反,子叶表现出一种替代的环排列,该环以与含MITE的启动子相反的方向包围整个基因,从而使得HaWRKY6基因能够表达。
在几种被子植物(如水稻、二穗短柄草、谷子、玉米、高粱和番茄)中,MITEs是microRNA(miRNA)库中新miRNA从头产生的主要来源,从而促进了其miRNA库的多样性。具体而言,双子叶植物中Mutator超家族的MITEs以及单子叶植物中Tc1/Mariner和PIF/Harbinger超家族的MITEs对MITE-miRNA的产生贡献显著。这些MITE超家族在宿主基因组中的大小和拷贝数似乎是决定其在miRNA生物发生中潜在作用的关键因素。产生miRNA的MITE拷贝与其它MITE拷贝相比,在假基因和内含子区域更为富集。MITE-miRNA靶向的基因在响应环境刺激(特别是温度相关过程)的功能上富集,这表明MITE-miRNA在植物适应变化环境条件中发挥作用。
MITEs影响环状RNA的产生
环状RNA(circRNA)是一类形成连续环状结构的非编码RNA,连接5'和3'末端。在所有真核生物中均有发现,它们影响基因表达。MITEs(与其他TEs一样)有助于植物中circRNA的产生。
例如,在毛白杨中,MITEs(特别是属于hAT和PIF/Harbinger超家族的MITEs)在产生circRNA的区域富集,并与circRNA丰度水平相关。此外,Circ_0003418的表达水平与侧翼MITE内的单核苷酸多态性(SNPs)存在关联。含有不同构型的Circ_0003418和Circ_0000408及其侧翼MITEs的转基因构建体证明,侧翼MITE中的特定单核苷酸多态性(SNP)显著降低转录本产量,表明MITEs在circRNA调控中具有潜在的顺式调控作用。
MITEs可触发DNA甲基化
转座元件吸引异染色质表观遗传标记。因此,MITEs可以诱导基因区域表观遗传模式的改变,这可能潜在地导致基因表达动态的调节。例如,插入拷贝的甲基化可能扩散到邻近基因,从而抑制它们。本节介绍说明此机制的一些实例。
在玉米中,Vgt1(营养生长向生殖生长转变1)基因座是调控开花时间的一个著名主要QTL。Vgt1被证明是开花抑制因子ZmRap2.7基因(位于Vgt1下游70 kb处)的顺式调控元件。Vgt1基因座的一个PIF/Harbinger MITE插入与早花性状相关(图2D)。值得注意的是,MITE插入与局部高甲基化相关,这影响了ZmRap2.7基因的转录,导致其表达降低和早花。ZmRap2.7转录活性的差异与等位基因特异性甲基化相关。这个详细的例子说明了由MITE插入产生的表观等位基因在控制玉米开花时间中的关键作用。
编码参与植物发育和胁迫响应的NAC转录因子的ZmNAC111基因,是玉米中MITE诱导表观遗传调控的另一个例子。位于ZmNAC111启动子区域内的一个82 bp Tc1/Mariner MITE插入与耐旱性显著相关。该MITE插入是干旱敏感品系特有的,并通过DNA甲基化和H3K9me2沉积触发ZmNAC111表达的抑制。在拟南芥和玉米转基因株系中过表达ZmNAC111,通过调节气孔运动和干旱响应基因的表达来增强耐旱性。
在苹果中,MdRFNR1是通过调节氧化还原系统来正调控耐旱性的因子。MdRFNR1编码一种NADP+氧化还原酶,参与将NADPH转化为NADP+,从而促进活性氧(ROS)减少。该基因的一个特定等位基因(MdRFNR1-1)在其启动子区域内含有一个430 bp的PIF/Harbinger MITE插入。与缺乏MITE插入的等位基因MdRFNR1-2相比,该等位基因被甲基化且对干旱有响应。被甲基化的含MITE等位基因被抗沉默因子(如SUVH和DNAJ蛋白)靶向,这使得干旱能够诱导MdRFNR1-1表达。这个例子说明了MITE插入如何通过招募这些元件,使得基因表达能够在干旱胁迫条件下被精确调控。
在水稻中,分蘖是影响植株结构和谷物产量的重要农艺性状,并受RdDM(RNA指导的DNA甲基化)通路调控。在正常生长条件下,OsMIR156d/j基因诱导水稻分蘖,并受到其各自启动子区域中两个MITEs上的CHH甲基化抑制。相反,其表达抑制分蘖的DWARF14基因,被下游一个MITE上的CHH甲基化激活,表明水稻植株的分蘖依赖于MITEs的RdDM依赖性甲基化状态。这些知识可用于开发该物种品种选择的标记。
MITEs促进可变剪接
由于MITEs优先插入基因富集区域,它们的插入也可以通过引入新的剪接位点序列或破坏基因内现有剪接位点的剪接模式来调节可变剪接机制,从而导致移码或截短的RNA等。此机制说明如下。
在桑树中,MITEs占基因组的14%。MITEs与不同组织类型中差异可变剪接的关联显示,可变5'和3'剪接位点是主要的MITE相关剪接变体。MITEs的外显子化,或参与可变剪接的MITEs,主要在花中富集,说明了MITEs可能通过剪接机制在该物种基因调控中发挥重要作用。
在胡萝卜基因组中,hAT-like MITEs常见于基因区域,并与基因共转录。它们也参与形成含有插入基因的新剪接变体。类似地,已报道存在差异外显子使用的基因也富含hAT-like MITEs。例如,对于两个基因(LOC108201852和LOC108220652),含MITE的异构体占主导地位。LOC108201852的非MITE包含异构体仅在苞片中表达,而含MITE的异构体在苞片、花、根和种子中高表达。LOC108220652基因的含MITE异构体在所有组织中均有表达,在苞片、开放花、叶、下胚轴、韧皮部和木质部中报道的表达量最高。相比之下,非MITE包含异构体仅在愈伤组织和叶中表达。因此,MITEs通过改变转录本和指导基因表达的时空调控,为胡萝卜新多样性的积累做出了贡献。
MITEs诱导突变
在新的插入位点,MITEs可以诱导突变和功能丧失。这些突变可能对发育性状产生影响,如下所述。
开花植物物种间花多样性的进化依赖于花瓣和萼片的结构。已知APETALA1(AP1)、APETALA3(AP3)、PISTILLATA(PI)和SEPALLATA1-4(SEP1-4)等主调控因子参与花发育。在一个天然无花瓣的黑种草突变体中,花瓣转变为萼片,导致花瓣缺失并出现双层萼片。基因表达分析和基因组序列调查显示,AP3-3(通常是AP3在花瓣中表达的旁系同源基因)的表达因第二个内含子中一个253 bp的MITE插入而失活。实际上,MITE插入并不阻止AP3-3表达,因为该基因在无花瓣纯合突变体中仍然被转录,但不产生功能性蛋白质。在杂合植物中,两个等位基因都表达,野生型等位基因导致功能性蛋白质的产生。这表明存在一个控制AP3-3表达的自我维持调控环路。在纯合植物中,由于缺乏蛋白质,该环路被破坏,而在杂合植物中,功能性等位基因产生的蛋白质似乎足以维持这个环路。有趣的是,在毛茛科其他几个谱系中,花瓣的缺失与通过各种基因组机制(如完全基因丢失、编码区或启动子区域的部分缺失,或在黑种草中观察到的MITE插入)导致AP3-3基因失活有关。
MITEs介导结构变异
也有证据表明MITE插入可以促进复杂的基因组重排。MITE拷贝可以通过重组导致染色体倒位、易位或其他结构变异,本节将介绍这些内容。
在甘蓝型油菜中,自花授粉由花瓣的开放和闭合行为控制。通过对自花授粉和异花授粉种质进行比较分析,鉴定出一个跨度约30 kb的遗传倒位(图2E)。该倒位导致组织特异性基因启动子在控制早花的BnaC03.EFO1和与F-box蛋白及闭花授粉相关的BnaC03.FBA之间发生互换(图2E)。在该倒位的每个断点处都检测到两个327 bp的PIF/Harbinger MITE插入,表明该MITE元件可能参与了结构变异的介导。
在被子植物中,生物合成基因簇(如那些参与萜类化合物产生的基因簇)的组织通常是通过基因复制、新功能化和基因组重排等过程产生的。Boutanaev和Osbourn表明,在真双子叶植物耧斗菜和伽蓝菜中,MITEs在成簇的萜类合酶和细胞色素P450基因周围富集,但在单子叶植物无油樟中则不然。他们认为MITE可能通过促进重组来驱动这些基因簇的形成,并且也可能有助于它们的调控,因为它们在基因附近过度 represented。
转座在行动中
MITEs主要处于休眠状态,但可以响应各种环境波动、宿主生物体内的基因组改变,或继杂交、组织培养或诱变之后,表现出自发激活。迄今为止,仅有少数MITE爆发被记录,其中一些描述如下。
在水稻中,PIF/Harbinger家族的mPing是首个被详细描述的活性MITE。虽然在大多数水稻品种中不活跃,但mPing在特定环境胁迫(如组织培养或辐照)下会变得活跃,并已在4个温带粳稻种质中观察到自然爆发。尽管缺乏转座酶编码序列,mPing的移动性是由其他自主转座子(如Ping和Pong)反式提供转座酶而实现的。值得注意的是,在特定的水稻种质(如EG4和AG123)中,mPing插入在冷胁迫条件下调节邻近基因的表达,从而重新连接调控网络(图2F和表1)。mPing与自主元件Ping之间缺乏共享的编码序列,这可能解释了为何Ping没有经历表观遗传沉默。此外,mPing的AT富集插入位点可能阻止其插入GC富集的外显子。
在超过十代的水稻重组自交系(RILs)群体中研究了mPing的流动性。在272个RILs中鉴定出总共87,450个mPing插入,对应于16,914个mPing位点。由于大多数插入是非亲本的,它们可能发生在重组自交系建立期间。作者还在RILs的177个亲本位点识别出742种切除模式,证明了MITEs从位点切除的能力。此外,作者观察到跨RILs的Ping拷贝数与新mPing插入频率之间存在强相关性。因此,Ping元件的活性和非沉默状态似乎控制着mPing的转座。
继mPing之后,几个额外的活性MITEs,包括nDart1、dTok和nDaiZ(均为hAT超家族成员)
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号