《Plant Biotechnology Journal》:Dynamics of Gene and Allelic Expression During Modern Hybrid Maize Breeding
1 引言
杂交优势或杂种优势,描述了杂交种相对于其亲本系表现出的增强的表型性能。自20世纪初的先锋性工作以来,玉米一直是杂种优势研究和利用的模式系统。如今,大多数玉米栽培品种都是杂交种,占全球谷物总产量的35%以上。尽管杂种优势在植物育种中取得了广泛成功,但其遗传基础长期以来一直存在争议。最近的群体遗传分析表明,显性、超显性和上位性效应共同促成了杂种优势。然而,杂种优势的潜在分子机制仍然是一个谜,尚未完全阐明。
在转录组水平上,所有可能的基因表达模式,包括加性、显性、低显性和超显性,广泛存在于玉米杂交种中。这些显性或超显性基因表达模式与经典遗传模型没有直接联系,但非加性基因表达可以部分解释杂交种的杂种优势变异。杂交种中基因表达模式的互补可能导致与任一近交亲本相比,产生数百个额外表达的基因。这种单亲表达(SPE)互补被假设有利于杂交种的发育可塑性和环境适应性。此外,杂交种中同一基因的等位基因在转录水平上表达不平衡的现象被定义为等位基因特异性表达(ASE),这可能有助于表型变异,并构成杂种优势的遗传基础。然而,这些研究中的一个主要挑战是这些基因表达模式尚未与杂种优势表型相关联。
在过去的60年里,玉米产量的增加在很大程度上依赖于单交杂交种的育种。现代玉米育种过程中期望性状的遗传增益以及潜在的遗传或基因组变化已被表征。改进的生物和非生物胁迫耐受性,例如对更高种植密度的适应,是产量增长的关键贡献因素。此外,有害遗传变异在决定表型变异模式和杂种优势方面起着重要作用。有害等位基因的逐步清除和遗传负荷的减少已被确定为促成育种成功的关键因素。然而,尽管取得了这些进展,关于杂交种中有害变异等位基因特异性调控如何影响表型变异和育种进展,我们的理解仍然不完整。
本研究对中国玉米育种史上具有里程碑意义的杂交种及其亲本自交系进行了全面的转录组分析。我们的研究揭示了杂种优势分子基础的基本见解。首先,我们观察到基因表达模式的权衡,与亲本相比,杂交种持续上调与光合作用相关的基因,同时下调胁迫响应通路。其次,等位基因特异性表达分析表明,现代育种逐步增强了对有害等位基因的抑制,并且这种等位基因表达模式在杂交育种过程中显示出选择特征。最后,我们建立了杂种优势与转录组可塑性之间的关联,后者通过基于熵的基因表达协调性指标在不同条件下进行量化。
2 结果
2.1 不同种植密度和发育阶段下玉米杂交种和亲本系的转录组分析
为了评估玉米杂交育种背后的基因表达动态,我们对20个具有历史意义的单交杂交种及相应的亲本自交系进行了转录组分析。这些亲本自交系被归类为六个杂种优势群。表型分析显示,与产量相关的性状,包括小区籽粒产量、穗粒重、穗粒数和生物量产量,表现出最高水平的杂种优势。在不同种植密度下,小区籽粒产量的遗传增益为48.073至55.655 kg/ha·年,其中杂种优势贡献了24.474至40.380 kg/ha·年的小区籽粒产量。相对于中亲值的杂种优势百分比在育种期间没有显著增加,这在很大程度上归因于亲本系性能的同步提高。然而,杂种优势百分比始终保持在较高水平(标志性杂交种平均为60.2%)。这些结果共同表明,现代育种取得了双重成功:提高了亲本系的性能,并有效利用了杂种优势来推动产量提升。
为了调查这一育种过程中的转录组变化,杂交种和亲本自交系在120,000株/公顷的高种植密度(HPD)和33,000株/公顷的低种植密度(LPD)下种植。我们在三个发育阶段收集叶片样本进行RNA测序。多维尺度分析和主成分分析显示,转录组主要按发育阶段聚类,强调了在基因表达分析中采用动态分析方法的重要性。当比较每个杂交种及其相应自交系的转录组时,MDS和PCA清晰地暗示了基因型之间的谱系关系。具体而言,杂交种的转录组始终位于其亲本系之间。
2.2 玉米杂交种与亲本之间光合作用和胁迫响应相关基因的表达权衡
为了表征杂交种和亲本自交系在不同种植密度处理下群体水平的基因表达变化,我们应用了多因素差异表达(DE)基因分析。当比较HPD与LPD时,我们在杂交种中鉴定出4843个DE基因,在亲本自交系中鉴定出2498个DE基因。值得注意的是,杂交种与亲本之间出现了数量多得多的DE基因(11,796个)。为了进一步探索这些DE基因的功能相关性,我们进行了基于基因本体(GO)的基因集富集分析(GSEA)。一个有趣的发现是,杂交种与亲本系之间的DE基因在光合作用相关功能类别中富集于上调,而在胁迫响应相关的GO术语中富集于下调。这种模式暗示了繁殖能力和胁迫防御机制之间的关键权衡,支撑了杂交种观察到的优异活力。
我们进一步研究了杂交种和亲本系中267个光合作用相关基因和2375个胁迫响应基因在不同发育阶段的表达模式。分析揭示了这些功能类别中一致的差异表达模式。与自交亲本相比,光合作用相关基因在杂交种中主要上调,而胁迫响应基因则倾向于下调。这种反向调节在多个发育阶段观察到,相当大比例的光合作用相关差异表达基因(59.8%–78.6%)在杂交种中表现上调,而胁迫响应基因(67.5%–70.2%)则表现下调。
我们研究了杂交种中单亲表达(SPE)基因的表达互补。在所有亲本系中,我们鉴定了14,127个表达基因、7405个沉默基因和10,789个具有基因型依赖性表达的基因。杂交种显示出类似的趋势。关键的是,亲本对平均含有979.9个SPE基因,其中56.9%(平均557.3个基因)在杂交种中表现出互补表达。此外,平均只有13.9个基因在杂交种中独特表达,而在双亲中都不存在。SPE基因的互补使杂交种能够表达比其亲本更多的基因,这一现象在所有基因型中一致观察到。此外,DE基因和SPE基因的数量与所有自交系以及杂交种亲本对的遗传距离呈正相关。
我们进一步表征了杂交种及其亲本系之间的加性和非加性基因表达模式。优势/加性比值的密度分布分析表明,大多数基因在杂交种中表现出加性表达。定量上,中亲加性表达平均占亲本DE基因的55.0%。显性表达占亲本DE基因的32.5%,包括18.3%的高亲显性和14.1%的低亲显性。部分显性占9.6%,而过显性表达模式相对罕见(1.4%高于高亲和1.6%低于低亲)。加性和非加性表达基因的比例在不同发育阶段、种植密度处理和基因型中表现出相似的分布。重要的是,GO GSEA显示,在LPD下15/20的杂交种和HPD下19/20的杂交种中,光合作用相关类别在高亲过显性基因中富集。这一结果与杂交种和亲本系之间光合作用相关基因的上调一致。
2.3 不同玉米杂交种和种植密度下的等位基因特异性表达
等位基因特异性表达(ASE)已成为促成杂交种表型多样性和杂种优势的重要调控机制。我们采用贝叶斯广义线性混合模型框架,全面表征了不同遗传背景和环境条件下的ASE模式。共使用了14,345个SNP用于ASE分析。该方法鉴定出2857个显著ASE SNP,涵盖1654个基因。基因本体分析显示,在表现出ASE的基因中,胁迫响应通路显著富集,包括几个先前表征的胁迫耐受相关基因。此外,光合作用的功能类别在ASE基因中也显示出显著富集。
现代玉米育种有效地降低了有害变异的频率,而这些稀有等位基因与表达失调和表型变异相关。我们的分析表明,SNP的ASE比率与相应的等位基因频率呈正相关,反映了携带稀有变异的等位基因在玉米杂交种中表达较低。比较分析显示,具有显著ASE的SNP表现出比非ASE SNP更高的等位基因频率相关性。低频变异(MAF < 0.1)表现出显著ASE的比例(63.2%)是常见变异(MAF > 0.1, 17.5%)的3.6倍。为了评估变异有害性如何影响等位基因调控,我们使用SnpEff注释对SNP的预测突变效应进行分类。结果显示,33.3%被预测具有大突变效应的SNP表现出显著的ASE,这比具有中度、低度或修饰效应的SNP观察到的比例高1.6倍。
先前的一项研究已经确定了1017个在现代育种选择过程中,在雌性和雄性杂种优势群中显示出同向或反向等位基因频率变化的基因。我们将显著的ASE基因与这1017个同向或反向选择的基因进行比较,确定30个ASE基因的等位基因频率是同向变化的,13个ASE基因在雌性和雄性杂种优势群之间是同向变化的,13个ASE基因仅在雄性杂种优势群中发生趋同变化。值得注意的是,这些ASE基因包括发育调节因子,如RLD1(一种控制叶角结构的HD-ZIP III转录因子)和根发育调节因子,我们观察到其具有显著的ASE以及杂种优势群中的同向频率变化。ZmMIPS1表现出显著的ASE,并仅在雄性杂种优势群中显示趋同变化,其同源基因AtMIPS1对生长和开花至关重要。这些发现表明,ASE基因参与了生长和胁迫耐受的生物学功能。
2.4 玉米杂交种中对种植密度胁迫的等位基因特异性响应
为了进一步探索每个杂交种中的ASE基因,我们采用基于单倍型定相的流程,根据基因水平的杂合变异来量化母本和父本单倍型表达。在杂交种中,22.4%–38.3%的分析基因表现出显著的亲本等位基因表达不平衡。杂交种ASE与亲本DE之间的比较分析表明,亲本DE基因在杂交种中表现出ASE的可能性更高。并且杂交种中ASE基因的比例随着亲本DE基因倍数变化的增强而增加。杂交种中的这些等位基因表达差异暗示了潜在的顺式调控差异。为了验证这一点,我们检查了等位基因表达不平衡和平衡基因的顺式调控区域中的遗传变异。值得注意的是,具有显著ASE的基因在其顺式调控区域中比平衡表达基因多出1.14至1.37倍的遗传变异。
我们随后应用贝叶斯信息准则模型来阐明杂交种中ASE和亲本中DE的调控模式。我们的分析显示,19.4%的亲本DE基因在杂交种中表现出顺式调控模式,其等位基因表达比率与亲本比例相似。相反,15.0%的亲本DE基因在杂交种中表现出平衡的等位基因表达,这表明是反式作用调控。大多数(55.4%)显示出顺式和反式调控效应的组合。然而,10.2%的亲本DE基因被归为意外模式,其中杂交种中的等位基因偏向与亲本中的方向完全相反。
为了研究环境对杂交种中等位基因特异性表达的影响,我们检查了等位基因表达偏向是否会在种植密度处理之间发生转变。值得注意的是,51.8%的ASE基因在LPD和HPD下都保持一致的亲本表达偏向。而22.6%和24.2%的ASE基因分别在LPD或HPD下表现出独特的ASE。只有1.4%的ASE基因在LPD和HPD之间显示出ASE方向的转变。
我们接下来通过分析等位基因特异性表达变化来研究每个亲本等位基因对杂交种中种植密度胁迫的响应方式。根据雌性或雄性等位基因在不同种植密度胁迫之间的表达倍数变化,将基因分配到不同的响应模式中。大多数胁迫响应基因(66.4%)表现出单等位基因响应,包括几乎相等比例的雌性(32.6%)和雄性(33.8%)等位基因特异性响应。在29.6%的基因中观察到协同响应,其中两个等位基因显示出相同方向的表达变化。而一小部分基因(4.0%)表现出拮抗响应,亲本等位基因之间的表达变化相反。
2.5 玉米杂交育种过程中有害等位基因抑制的变化
有害变异的清除代表了玉米育种改良背后分子基础的基本原理。有害等位基因的互补在杂交种的优异表型性能中起着重要作用。我们研究了经历数十年育种选择的杂交玉米系中有害等位基因和表达模式的变化。我们的分析揭示了杂交种中有害等位基因总数随育种历史呈下降趋势。相反,我们观察到杂交种释放年份与互补有害等位基因数量之间存在正相关关系,互补有害等位基因被定义为在一个亲本等位基因中携带有害变异而在另一个中没有的基因。表型分析表明,籽粒产量往往与互补有害等位基因数量呈正相关,而与有害等位基因总数呈弱负相关。这些结果共同表明,育种选择趋势是减少有害等位基因负荷并增加这些位点的杂合度。
有害变异的转录抑制可能代表了对抗其有害表型效应的重要保护机制。我们对互补有害等位基因对的分析显示,43.6%–62.6%的这些对表现出有害等位基因抑制,其特征是功能等位基因相对于其有害对应物的表达更高。值得注意的是,受抑制的有害等位基因比例与杂交种释放年份呈显著正相关,表明现代育种选择不仅消除或互补有害变异,而且还优先维持其低表达水平。重要的是,这种抑制现象与小区籽粒产量呈正相关,表明其与优良杂交种产量提升的功能相关性。
我们关于有害等位基因抑制的发现暗示了顺式调控机制在杂交种改良中的作用。为了评估在育种过程中,顺式调控区域是否比编码序列受到更强的选择压力,我们使用基因组进化速率谱分析了互补的有害变异。比较分析显示,顺式调控区域中互补有害变异的积累与杂交种释放年份、小区籽粒产量以及小区籽粒产量的杂种优势的相关性比CDS区域更强。我们进一步进行了eGWAS分析,并鉴定了与19,208个基因相关的3,572,171个顺式-eQTNs。这些顺式-eQTNs在不同杂种优势群的育种选择特征中显著富集。这些结果证明了在玉米育种改良过程中,顺式调控元件受到了优先选择。
2.6 杂种优势依赖于“负熵”
我们假设杂交种的优异适应性与其基因调控网络增强的动力学或可塑性相关。受薛定谔“负熵”作为基本生命原理概念的启发,我们应用香农熵分析来评估转录组动力学。玉米杂交种表现出比其亲本自交系显著更低的转录组熵。杂交种转录组中观察到的香农熵降低表明,在不同发育阶段和种植密度下,基因表达分布更不均匀、更具结构性。在信息论的背景下,这种较低的熵表明了一种更高有序度和更低随机性的状态,我们将其解释为一种更协调、可能更灵活的转录组配置,能够对不同的生长条件进行优化响应。重要的是,熵减少的程度与关键农艺性状的杂种优势水平呈正相关,包括小区籽粒产量、粒重、粒数和生物量产量。这种现象不仅限于玉米,对拟南芥杂交种(Col-0 × Per-1)的分析同样显示,与亲本生态型相比,幼苗发育期间的转录组熵降低,支持了植物杂交种中转录可塑性的保守机制。
为了验证杂交种中增强的转录组动力学,我们对不同种植密度和发育阶段下的共表达网络进行了层次聚类分析。杂交种表现出比其亲本系显著更多的共表达簇,表明转录灵活性增强。我们进一步构建了基因调控网络(GRN)来检查转录因子-靶基因相互作用。比较分析揭示了杂交种中网络的显著扩展,连接基因相对于雌性和雄性亲本分别增加了1.52倍和1.49倍。网络复杂性同样增加,基因对比任一亲本多1.92倍和1.81倍。值得注意的是,39.2%的杂交种GRN连接代表了双亲中都不存在的新相互作用。并且杂交种GRN中有线连接的基因对中,只有2.88%是从其亲本遗传而来。这些发现表明,杂交诱导了深刻的转录组重连,暗示网络层面的机制可能补充遗传模型来解释杂种优势。
3 讨论
自20世纪60年代单交杂交种发展以来,美国和中国的玉米产量分别增加了4.5倍和2.7倍,这两个国家是世界上最大的玉米生产国。了解育种改良的分子基础对于提高育种效率非常重要。先前的研究调查了玉米驯化和改良过程中的遗传和基因组变化。目前的证据表明,驯化瓶颈增加了有害等位基因频率,而现代育种逐步减少了这种遗传负荷。此外,优良等位基因的积累有助于表型变异。我们对具有历史意义的中国杂交种的分析揭示了现代育种过程中有害等位基因数量的持续下降。值得注意的是,互补的有害等位基因比例与杂交种的释放年份和籽粒产量呈正相关。这些发现表明,有害等位基因的互补一直受到选择,并为现代杂交玉米育种做出了贡献。
调控遗传变异在作物驯化和适应中发挥了关键作用,玉米中已克隆QTLs的64%自然变异可归因于调控变化。比较转录组分析揭示了玉米驯化和改良过程中共表达网络的重组。值得注意的是,负责这些转录组变化的关键调控基因在胁迫响应通路中功能富集。此外,杂交种及其亲本的基因表达变异已在不同植物中得到表征。尽管玉米杂交种的许多性状表现出优异的性能,但在不同组织和不同杂交种中,大多数基因表达模式是加性的。本研究一个有趣的发现是,与亲本相比,光合作用相关基因在杂交种中偏向于过显性表达,而与胁迫响应相关的基因则下调。我们观察到的光合作用相关基因和胁迫响应基因之间的表达权衡表明,基因网络存在潜在的重编程,使杂交种能够在不同条件下生长更快、积累更多生物量并产生更高产量。一致地,先前的研究表明,拟南芥杂交种中增强的光合作用与营养生长活力相关。此外,拟南芥杂交种表现出光合作用功能内中枢调控基因的高亲显性表达互补。胁迫相关基因在正常条件下表达受到抑制,但在胁迫条件下在杂交种中被诱导至中亲或更高水平。理解玉米中胁迫响应与生长调控通路之间的调控相互作用,将有助于设计在不利环境条件下仍能保持高生产力的抗逆作物品种。
等位基因特异性表达(ASE)代表了杂交种中的重要调控机制。Guo等人首次报道了植物杂交种中的ASE模式,证明了玉米杂交种中亲本等位基因对非生物胁迫响应的差异表达。通过全基因组ASE分析,我们发现等位基因对种植密度胁迫的特异性响应在玉米杂交种中普遍存在。基因编码序列中的大效应变异,例如蛋白质截断变异,经常导致功能丧失等位基因,并可能表现出被抑制的等位基因表达。我们的研究结果显示,有害等位基因抑制的比例与育种改良期间杂交种产量增加呈显著正相关,支持了顺式调控选择在杂交育种中的主要作用。值得注意的是,顺式调控区域中有害变异的互补比编码变异显示出更强的选择特征和产量相关性,这与先前观察到的玉米驯化和改良过程中顺式调控区域选择特征一致。
自达尔文首次记录杂种优势以来,这一现象的遗传基础一直是一个持续争论的主题。杂种优势的遗传基础主要通过两个经典模型来解释:显性假说和超显性假说。虽然单一位点超显性可以在特定情况下驱动杂种优势,但全基因组研究表明,显性效应在大型杂交群体中与产量或其他性状相关的位点普遍存在。然而,这些遗传模型仍然不完整,促使了像基因平衡假说和蛋白质质量控制假说这样的替代框架来弥补其局限性。我们的研究引入熵作为杂种优势的新指标,量化杂交种在不同发育阶段和胁迫条件下的转录组可塑性。熵减少与杂种优势之间的显著相关性,与薛定谔“负熵”作为生物组织原则的概念相一致。杂交种中较低的转录组熵,意味着从均匀的表达分布向更具结构性的分布转变,可能反映了一个更“协调”的转录程序。这种增加的协调性可能通过减少转录噪音和集中表达于关键通路来提高资源分配的效率,从而通过提供更大的表型稳定性和适应性来促进杂种优势。这种转录熵减少机制反映了在其他生物系统中观察到的现象。尽管建立了降低的转录组熵与杂种优势之间的联系,未来的研究仍存在关键问题——特别是关于杂交种中转录组熵减少的潜在机制以及关键调控基因在这一过程中的潜在作用。
4 结论
总之,本研究提供了中国杂交玉米发展史上标志性杂交种及其亲本自交系的转录组概览。我们展示了玉米发育和种植密度适应过程中基因和等位基因表达调控的动态。我们的发现推进了对玉米杂交育种改良和杂种优势的分子理解,并建立了一个新的分子育种框架,该框架利用关键等位基因的表达优化来增强杂交种性能。