亲本来源效应调控三倍体枇杷幼苗活力杂种优势的转录重编程与表观遗传机制
《Frontiers in Plant Science》:Parent-of-origin effects orchestrate transcriptional reprogramming and epigenetic regulation of seedling vigor heterosis in triploid loquat
【字体:
大
中
小
】
时间:2025年10月21日
来源:Frontiers in Plant Science 4.8
编辑推荐:
本研究聚焦于高度杂合的多年生木本果树枇杷,通过整合转录组、等位基因特异性表达(ASE)及等位基因特异性甲基化(ASM)分析,首次系统揭示亲本来源效应(POE)是三倍体枇杷幼苗活力杂种优势的主要驱动力。研究发现,父本基因组过剩[3x(p)]通过协调光合作用、淀粉代谢及植物昼夜节律等关键通路上调,并伴随独特的等位基因表达模式(母本偏向基因数量,父本增强表达水平)及非经典表观调控机制(父本基因体超甲基化(mCG)促进转录),最终通过重编程核心生物钟基因(如EjCCA1、EjLHY等)的昼夜表达节律,优化代谢效率,从而显著增强幼苗活力。该研究为多年生木本植物多倍体杂种优势理论提供了重要分子证据,并为无核枇杷品种的遗传改良提供了新靶点。
多倍体是指生物体拥有超过两套染色体的状态,在植物界是一种广泛的进化力量,也是作物育种的有力工具。三倍体植物具有三套染色体,通常表现出多倍体杂种优势(活力增强)和不育性。这些特性使它们非常适合于培育枇杷等水果作物的无核品种。枇杷作为一种高度杂合的多年生木本植物,其幼苗早期生长优势对于长期表现和整体生产力至关重要。然而,其潜在的分子机制,特别是杂交性、倍性水平和亲本来源效应(POE)的相对贡献,在枇杷中仍然很大程度上未知。
尽管这三者对三倍体杂种优势的相对贡献仍存在争议且依赖于具体情境,但近期研究在其他植物系统中为它们各自的作用提供了重要见解。在拟南芥和玉米中的研究表明,倍性水平本身对三倍体杂种优势的影响很小,而亲本基因组剂量和杂交性是主要驱动因素。为了厘清这些因素,研究人员在拟南芥中构建了同基因型的相互反交三倍体,揭示了莲座丛大小的杂种优势存在反交差异,在父本过剩三倍体[3x(p),来自二倍体(2x)×四倍体(4x)]中表现出正效应,而在母本过剩三倍体[3x(m),来自4x×2x]中表现出负效应。这表明亲本剂量本身可以诱导杂种优势,并凸显了POE在调控表型结果中的作用。然而,这些贡献因性状而异。在甜菜中,杂交性主要驱动产量相关性状,而父本基因组剂量效应在营养性状(如叶面积和株高)中更为明显。这些POE并不局限于一年生物种,在多年生园艺育种中具有重要的实际意义。在苹果中,杂交方向直接影响三倍体的产生率。类似地,在柑橘中,亲本选择是农艺性状的关键决定因素,范围从幼年期持续时间到最终的果实品质参数(包括酸度和糖含量)。这些见解共同强调了三倍体杂种优势的性状和物种特异性,说明有必要在不同的植物系统中探索其潜在的分子机制。
在分子水平上,三倍体杂种中不平衡的2:1亲本基因组比例创造了一个独特的调控范式,其中等位基因特异性表达(ASE)变得普遍。这种基因组剂量不平衡通常导致一个亲本等位基因优先于另一个表达,产生等位基因不对称,这是POE的关键分子基础。这种不对称表达的表型后果在三倍体拟南芥中得到例证,父本基因组过剩可以改变淀粉代谢途径基因的表达,导致淀粉含量增加和生长活力增强。类似地,核心生物钟基因在三倍体杂种中表现出不同的表达模式,这些改变的节律与生长杂种优势直接相关,而与营养储备活性相关的基因则表现出依赖于POE的表达变化,这有助于相互反交三倍体之间的种子大小差异。这些依赖于POE的表达模式通常受表观遗传调控支配,其中DNA甲基化可以沉默或激活特定的亲本等位基因。基因组印记是这种调控的一种形式,由亲本特异性甲基化导致单等位基因表达,已成为三倍体中POE的关键机制。
近期研究采用高通量转录组和亚硫酸氢盐测序来揭示复杂的依赖于POE的表达模式及其表观遗传调控。这些努力主要集中于在具有简化遗传背景的模式植物和一年生作物中研究ASE和DNA甲基化在三倍体杂种优势中的作用。然而,对于具有高度杂合背景的多年生果树,关于杂交性、倍性水平和POE如何通过基因表达和表观遗传学相互作用的研宄仍然很少。填补这一空白对于揭示三倍体杂种优势的遗传和表观遗传基础至关重要,有助于优化亲本选择、分子标记开发以及培育具有增强性能的优良无核品种。
基于我们已观察到的在3x(p)杂种中显著的幼苗活力杂种优势(特别是在株高方面),本研究利用一系列具有清晰遗传背景的相互反交2x、3x和4x杂种群体来剖析三倍体杂种优势的分子机制。为此,我们首先对所有群体进行RNA-seq分析,以在转录组水平上量化杂交性、倍性水平和POE对三倍体杂种优势的相对贡献。随后,对L2和L4之间的反交组合进行深入研宄,整合转录组、全基因组ASE和等位基因特异性甲基化(ASM)分析,以阐明POE的分子机制及其在三倍体杂种优势中的作用。总之,这些发现有望为多年生木本植物三倍体杂种优势的复杂遗传和表观遗传基础提供有价值的见解,为优良无核枇杷品种的遗传改良提供新靶点。
本研宄所用的植物材料包括一系列枇杷群体。其中包括四个亲本品系:来源于红肉品种‘龙泉1号’的L2(2n=2x=34)和L4(2n=4x=68);来源于白肉品种‘软条白沙’的R2(2n=2x=34)和R4(2n=4x=68)。杂种群体包括(i)相互反交2x杂种(R2×L2和L2×R2)(按照惯例,杂交中母本列在父本之前);(ii)相互反交3x杂种,包括母本过剩三倍体[3x(m): R4×R2, R4×L2, L4×R2, 和 L4×L2]和父本过剩三倍体[3x(p): L2×L4, R2×R4, L2×R4, 和 R2×L4];(iii)相互反交4x杂种(R4×L4和L4×R4)。除了F1杂种,每个亲本品系(L2, L4, R2, 和 R4)的自交后代也被作为亲本对照产生。杂交、倍性水平确认和杂种真实性的详细方法在我们之前的工作中已有描述。所有幼苗在受控温室条件下的土壤盆中培育,维持16小时光照/8小时黑暗的光周期。6个月后,幼苗被移栽到西南大学多倍体枇杷种质资源圃。
用于转录组测序的年轻、完全展开的叶片从所有杂种群体及其相应的亲本群体中收集。我们的取样策略旨在捕捉每个群体的转录组代表性并最小化个体变异的影响。对于每个杂种和亲本品系,总共选择9株个体植物。将这9个个体随机分配到三个生物学重复中,每个重复由来自三个不同植物的等量混合叶片组织组成。然后使用EASYspin植物RNA提取试剂盒从这些混合样品中提取总RNA。提取后,使用Ribo-ZeroTM Magnetic Kit去除rRNA,并将链特异性cDNA文库在Illumina HiSeq X-Ten平台上进行测序。原始读长序列已存入NCBI序列读长档案库。经过质量过滤后,使用HISAT2将清洁读长比对到全基因组重测序分析中使用的相同枇杷参考基因组。使用Salmon将基因表达量量化为每千个碱基的转录本每百万映射读长的片段数(FPKM)。使用DESeq2包鉴定差异表达基因(DEGs),应用阈值为绝对log2转换的倍数变化≥1且P值<0.05。使用基因本体论(GO)和京都基因与基因组百科全书(KEGG)数据库对鉴定到的DEGs进行功能注释和通路富集分析。
对于WGBS及随后的DNA甲基化分析,选择相互反交三倍体组合L2×L4 [3x(p)]和L4×L2 [3x(m)]作为代表。选择这一对是因为它们在所有二倍体-四倍体杂交中遗传差异最小,这有助于放大POE信号。此外,它们表现出明显的表型对比,L2×L4的株高大于L4×L2,与3x(p)相对于3x(m)杂种更强的杂种优势一致。从每个杂交组合中总共九个个体随机混合成三个生物学重复。使用CTAB法从所选样品中提取基因组DNA。纯化的DNA片段然后使用EZ DNA Methylation-Gold Kit进行亚硫酸氢盐处理。WGBS文库在Illumina平台上进行测序,原始数据已存入SRA。使用FastQC和Trimmomatic过滤原始读长以去除接头和低质量碱基。然后使用Bismark将清洁读长比对到枇杷‘解放钟’参考基因组。mCG、mCHG和mCHH上下文中的每个胞嘧啶的甲基化水平计算为甲基化读长数与覆盖该位点的总读长数的比率。仅考虑覆盖度至少为5个读长的胞嘧啶进行进一步分析。计算所有注释基因的基因体整体甲基化水平。
将来自相互反交杂种(L4×L2 vs. L2×L4)的RNA-seq读长使用HISAT2比对到参考基因组。为了识别来自每个亲本等位基因的读长,我们利用了先前在亲本对照之间鉴定出的高置信度SNP集。使用GATK中的ASEReadCounter工具在信息性SNP位点计数支持每个亲本等位基因的读长数。对于一个基因要被考虑进行ASE分析,它需要包含至少1个信息性SNP,且在所有生物学重复中覆盖度至少为10个总读长。对于3x杂种,预期的等位基因比率为2:1(4x vs. 2x)。进行二项式检验以评估每个SNP处两个亲本等位基因的观察读长计数是否显著偏离预期的2:1比率。使用Benjamini-Hochberg方法调整P值以控制错误发现率(FDR)。如果一个基因中至少有1个SNP的FDR < 0.05,则该基因被归类为表现出显著的ASE(一个ASEG)。如果一个基因的父本或母本等位基因的表达水平显著高于预期的2:1剂量比率,则该基因被定义为父本偏向或母本偏向。
为了剖析ASE背后的表观遗传机制,我们进行了ASM分析。使用SNPsplit将来自杂种(L4×L2和L2×L4)的Bismark比对WGBS读长划分为亲本特异性集合,该工具基于已知杂合SNP位点的序列分离读长。此过程为每个杂交组合内的L2和L4来源的等位基因生成等位基因分辨的甲基化组。分别计算每个亲本等位基因的每个胞嘧啶的甲基化水平。为了量化ASM,我们专注于已鉴定ASEGs的基因组区域(下游、基因体、上游)。对于一个基因内的每个区域,我们计算L2和L4等位基因之间平均甲基化水平的绝对差值作为ASM差异。为了评估POE对ASM的影响,使用Wilcoxon秩和检验比较相互反交杂种(L4×L2 vs. L2×L4)之间这些ASM差异值的分布。使用Integrative Genomics Viewer(IGV)可视化单个位点,显示等位基因特异性RNA-seq覆盖度和DNA甲基化模式。
qRT-PCR在所有杂种群体及其亲本对照的cDNA上进行,该cDNA由提取的RNA合成。使用基于SYBR Green的预混液在Bio-Rad CFX 96实时PCR检测系统上进行反应。为了确定相关基因的表达水平,将它们归一化到内参基因并使用2?ΔΔCt方法计算。qRT-PCR用于两个不同的目的。首先,为了对RNA-seq数据进行一般的技术验证,随机选择了10个显示一系列表达模式的DEGs。其次,为了对我们核心假设进行特定的生物学验证,对关键生物钟基因进行了详细的昼夜表达分析,在ZT0、ZT6、ZT12和ZT18时间点收集样品。所有反应均进行3个生物学重复和3个技术重复。
三倍体枇杷中POE驱动的基因表达变化的全局转录组分析
为了研究枇杷三倍体杂种优势的转录基础,我们对所有杂种群体和亲本对照进行了RNA-seq分析。总共48个cDNA文库产生了超过325.54 GB的高质量清洁数据。我们RNA-seq数据集的整体技术可靠性通过随机选择的10个DEGs的qRT-PCR分析得到验证,结果显示与RNA-seq结果有很强的相关性。
系统的成对比较揭示了与亲本基因组剂量效应相关的实质性转录重编程。最显著的发现是POE比较[3x(p) vs. 3x(m)]产生了最大数量的DEGs(784个基因),显著超过了倍性水平差异(3x vs. 2x亲本:218个DEGs;3x vs. 4x亲本:652个DEGs)和倍性水平内杂交性效应(2x vs. 2x亲本:90个DEGs;4x vs. 4x亲本:8个DEGs)的影响。为了评估亲本遗传距离对转录反应的影响,我们将3x杂种分为2组,基于亲本遗传距离,包括来自品种内杂交的3x(h)(即L2×L4和L4×L2)和来自品种间杂交的3x(l)(即L2×R4和R4×L2)。值得注意的是,来自遗传距离较远的亲本的三倍体之间的比较显示出最小的转录差异(5个DEGs),可能反映了POE在塑造全局转录谱方面相对于遗传背景效应的主导贡献。因子贡献分析显示,POE在转录组水平上主导了三倍体杂种优势,这得到了POE响应DEGs数量超过倍性和杂交性效应单独作用的支持。
为了识别与优越3x(p)性能相关的表达模式,所有DEGs使用Mfuzz进行了模糊c均值聚类。该分析揭示了5个不同的簇,其中簇3显示了最相关的谱,其基因表达在3x(p)杂种中在所有群体中最高。因此,簇3中的4,688个基因使用K-means聚类进一步划分为10个子簇(C1-C10)以进行详细的功能分析。
这些子簇的KEGG富集分析显示,多个簇(C1, C2, C3, C9, 和 C10)在光合作用相关通路中显示出显著富集,包括“光合作用”和“光合作用-天线蛋白”。这表明增强的光能利用效率,特别是通过提高光捕获复合体的活性,构成了3x(p)杂种优势的潜在决定因素。促进生长的激素通路也显著富集,赤霉素合成的“二萜类生物合成”在C10、C3和C5中显著富集,细胞分裂素合成的“玉米素生物合成”在C2、C7和C6中富集。这些植物激素通路的协调作用对于茎伸长和整体植物发育至关重要,为观察到的三倍体杂种优势提供了分子支持。此外,氮代谢通路,特别是“氮代谢”和“精氨酸生物合成”,在C2、C8、C4和C6中显著富集,表明3x(p)具有改善的氮吸收、同化和利用效率,从而为蛋白质和核酸合成提供充足的前体,促进植物生长。此外,“氨基糖和核苷酸糖代谢”在C1中富集,通过介导核苷酸糖(包括ADP-葡萄糖,它是淀粉合酶的直接底物)的产生,直接支持提高的光合作用效率。 collectively,这些代谢和生理通路内DEGs的协同上调为在3x(p)杂种中观察到的杂种优势幼苗活力性状的优越性能提供了全面的分子支持。
L2×L4和L4×L2三倍体杂种中POE机制的等位基因特异性表达分析
基于将POE确定为转录变异主要驱动因素的全局转录组发现,我们专注于相互反交三倍体L2×L4 [3x(p)]和L4×L2 [3x(m)]进行深入的分子分析。选择这一对作为代表杂交组合是因为它在所有二倍体-四倍体杂交中遗传差异最小,有助于最小化其他遗传背景因素的影响并更好地突出POE。表型数据进一步证实了这一点,L2×L4显示出比L4×L2植物更大的株高,与3x(p)相对于3x(m)杂种更强的杂种优势一致。
L2×L4和L4×L2之间的比较转录组分析揭示了大量的重编程,鉴定出1,377个DEGs,包括463个上调和914个下调。遗传相似的相互反交杂种之间这种程度的转录差异表明POE可能驱动了观察到的基因表达模式。GO分析显示在“DNA结合转录因子活性”和“转录调节活性”等模块中显著富集,表明POE通过分层调控网络影响杂种生长。进一步的术语如“碳水化合物代谢过程”和“植物型细胞壁生物发生”与株高的杂种优势相关。KEGG通路在“淀粉和蔗糖代谢”、“氮代谢”和“植物激素信号转导”中富集,表明剂量效应对碳水化合物动态、氮效率和激素稳态的影响。这些结果与第3.1节中的全局转录组模式紧密一致。有趣的是,“植物昼夜节律”通路也富集,表明亲本剂量调节基本节律,如生长时间和代谢同步,可能有助于杂种优势。这些转录组结果验证了选择该杂交组合作为POE研究的代表模型,并暗示剂量不平衡破坏了敏感的调控网络。总之,POE驱动的不对称表达促使对潜在等位基因机制进行更深入的调查。
为了揭示POE驱动的转录差异的等位基因基础,我们进行了全基因组ASE分析。分析揭示了一个显著的母本优势,控制着等位基因特异性表达位点(ASEGs)的数量。在L4×L2杂交中,772个ASEGs(占信息基因的9.44%)表现出对L4等位基因的母本偏向,而只有310个ASEGs(3.79%)显示出对L2等位基因的父本偏向。这种模式在相互反交的L2×L4杂交中得到进一步加强,932个ASEGs(11.40%)显示出对L2的母本偏向,而150个ASEGs(1.84%)显示出对L4的父本偏向。这些数量上的不对称性证明了母本在等位基因选择中起主导作用,可能由表观遗传标记介导,这些标记在早期胚胎发生期间沉默父本同源物。然而,深入探究等位基因表达幅度揭示了一个对比鲜明的调控模式。散点图显示L2偏向的ASEGs(橙色点)主要聚集在恒等线下方,表明当L2等位基因父本遗传时(L4×L2)其表达更高。相反,L4偏向的ASEGs(蓝色点)主要聚集在恒等线上方,反映了当L4等位基因作为父本贡献者时(L2×L4)其表达增强。母本因子似乎决定哪个等位基因被表达,可能通过类似印记的沉默机制,而父本贡献则用于放大这个选定等位基因的表达,可能通过减少抑制或激活其启动子。最终,这种复杂的相互作用代表的不仅仅是简单的亲本优势,而是POE的微妙分子基础,它通过产生等位基因不对称来优化杂合背景下的基因剂量,从而支撑三倍体杂种优势。
基因组印记是一种典型的POE机制,以严格的单亲本表达为特征,代表了这种父本增强的一种极端形式。我们应用严格标准(要求在两个相互反交杂交中一致、显著的单亲本偏向,FDR < 0.05)并鉴定出6个候选父本表达基因(PEGs)。例如,5号染色体上的Ej00021050显示出强烈的父本偏向。在L4×L2中,父本来源的L2等位基因约占转录本的95.5%。相反,在相互反交的L2×L4中,父本L4等位基因占主导地位,贡献了62-69%的转录本。这种不依赖于等位基因序列的POE依赖性表达是父本印记的典型标志。在功能上,这些PEGs在代谢调节因子(如淀粉相关酶)中的富集强烈暗示它们直接促进了3x(p)杂种中淀粉积累的增加和生长。然而,我们在枇杷叶片组织中鉴定到的印记基因数量低于拟南芥等模式植物种子组织中报道的数十个。我们提出这种差异反映了枇杷作为多年生和高度杂合物种的独特生物学背景。这一发现最终强调了开发物种和性状特异性POE模型以推进果树育种的必要性。
L2×L4和L4×L2三倍体杂种中与POE相关的等位基因特异性DNA甲基化
为了研究我们ASE分析中鉴定出的POE驱动的等位基因表达模式背后的表观遗传机制,我们对L4×L2和L2×L4相互反交组合进行了全基因组亚硫酸氢盐测序(WGBS)并进行了整合的等位基因特异性甲基化(ASM)分析。ASE分析揭示了基因体(TSS到TTS区域)上背景特异性的亲本剂量效应。在mCG上下文中,父本等位基因在L4偏向和L2偏向的ASEGs中 consistently 表现出比母本等位基因更高的甲基化。这种父本优势在mCHH上下文中持续存在,但在3'区域靠近TTS时发生逆转。相比之下,mCHG仅在L4偏向的ASEGs中显示出父本优势,表明了一种更细微的模式。因此,POE特异性的甲基化模式主要在mCG上下文中观察到,表现为基因体区域父本等位基因的高甲基化,这种现象被称为基因体甲基化(gbM)。关键的是,这种父本偏向的gbM与父本等位基因表达水平的增强显示出强烈的正相关。
基于此,我们进行了ASM分析以量化每个杂交组合内L2和L4亲本等位基因之间的甲基化差异。在L4偏向的ASEGs中,父本过剩杂种(L2×L4)启动子区域的mCG甲基化差异(ASM差异)显著高于其母本过剩杂交组合(L4×L2)。这一结果表明,在L2×L4杂交中,活跃表达的L4等位基因(来自父本)的启动子可能深度低甲基化,而受抑制的L2等位基因(来自母本)的启动子高度甲基化,导致显著的甲基化差异。这种模式与经典的表观遗传调控机制一致,其中等位基因表达的激活和沉默分别与启动子低甲基化和超甲基化相关。
在基因体区域,父本等位基因的超甲基化与其表达水平的增强显示出强烈的正相关。为了在单一位点水平验证这一发现,我们使用IGV可视化了参与杂种优势的关键功能基因的ASE和甲基化状态,包括代表性基因,如EjPsaN(光合作用)、EjCP2410A(光合作用-天线蛋白)、EjSUCS(淀粉合成)以及核心生物钟基因EjTOC1和EjLHY。IGV截图 consistently 显示,在转录水平上,父本等位基因系统地表现出比母本等位基因更高的转录本丰度。与此表达模式平行,基因体ASM谱也显示出类似的不对称性。具体来说,高表达的父本等位基因与其超甲基化相关,而低表达的母本等位基因则是低甲基化的。这一观察结果与我们的ASE分析一致。值得注意的是,核心生物钟基因的基因体在mCG甲基化上表现出不对称性。这种修饰显著存在于高表达的父本等位基因上,但在相应的母本等位基因上缺失。与先前的工作一致,这些结果表明基因体甲基化在增强核心昼夜节律调节因子中父本等位基因表达的可能促进作用,可能通过优化的昼夜节律驱动杂种优势。
POE影响下三倍体枇杷核心生物钟基因的昼夜表达分析
POE的表观遗传调控,结合POE影响的DEGs中“植物昼夜节律”通路的富集,将生物钟定位为POE的关键下游靶点,使我们提出假说:亲本剂量重编程了核心生物钟。作为植物生理的主调节器,协调光合作用和淀粉周转等基本过程,我们提出其重编程介导了观察到的三倍体幼苗活力杂种优势,这得到了关于钟驱动代谢优化和杂种优势的研究的支持。为了验证这一点,我们对4个核心钟组件EjCCA1、EjLHY、EjGI和EjTOC1在ZT0、ZT6、ZT12和ZT18时间点进行了基于qRT-PCR的昼夜表达分析。
在2x和4x群体中,四个钟基因表现出昼夜振荡,与拟南芥等经典模型相比,枇杷中存在显著的相位偏移,可能反映了枇杷的亚热带适应性。具体来说,推定的早晨表达基因EjCCA1和EjLHY显示出相反的相位,EjCCA1在ZT6表达最低(谷值),转录本水平在光照期结束或傍晚初升至峰值,而EjLHY显示出类似趋势但谷值延迟至ZT12。相反,推定的傍晚表达基因EjGI和EjTOC1通常在一天中较早达到峰值(ZT6或ZT12),然后下降。这种保守的反相关系,尽管相对于模型系统相位相反,证实了枇杷核心反馈环的功能性。
然而,这种核心振荡网络在三倍体枇杷中被重编程,其中不平衡的亲本基因组剂量表现为表达水平、相位和节律模式的显著POE依赖性改变。这些变化在3x(p)和3x(m)杂种之间的比较中最为明显。对于EjCCA1,3x(p)(即R2×R4)中的表达在ZT18相对于其3x(m)对应物 dramatically 升高,表现出强烈的、特定于3x(p)的晚日上调。类似的、尽管不太明显的父本过剩驱动的升高在R2×L4 vs. L4×R2中观察到EjLHY。剩余的钟组件也表现出强烈的POE。对于EjGI,在3x(p)杂种(L2×R4)中表达在所有时间点维持在组成型高水平,而在3x(m)杂种(R4×L2)中被严重且组成型地抑制。EjTOC1表达的重编程在所有三倍体反交组合中特别明显,父本基因组过剩诱导其节律振幅普遍减弱(在L4×L2中约减少40%),这反过来在3x(p)如L2×L4、R2×R4和L2×R
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号