剖析玉米单倍体脆弱性遗传变异以增强双单倍体育种效率

【字体: 时间:2025年10月08日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  本研究系统评估了192对BS39同基因单倍体-二倍体材料,量化了八个农艺性状的单倍体脆弱性(HF),并整合了单倍体育性、基因组预测和全基因组关联分析(GWAS)。研究发现单倍体在株高和穗位高上平均降低30-40%,但部分性状(如雄穗分枝数)表现出微弱甚至负向脆弱性,揭示了天然高活力单倍体的存在。遗传力分析表明二倍体(0.8-0.9)和单倍体(0.7-0.9)性状具有高遗传力,而HF遗传力较低(0.1-0.7)。相关性分析显示二倍体与单倍体性能呈强正相关(r=0.5-0.9),单倍体性能与HF呈中度负相关(r=-0.4至-0.6)。值得注意的是,单倍体雌性育性(HFF)与活力性状正相关,表明活力与育性协同改良可行。基因组预测显示二倍体数据对单倍体性状预测精度中等(0.3-0.5),但对HF预测能力较弱,凸显直接评估单倍体的必要性。GWAS检测到多性状显著SNP,并鉴定出细胞周期调控(Myb3R-1)、生长素信号(SRS1, SAUR-like)、细胞骨架组织(PRONE-domain)和氧化应激保护(HGGT1)等候选基因,为玉米DH育种提供了重要遗传靶点和理论依据。

  

引言

玉米(Zea mays L.)作为全球最重要的谷类作物之一,养活了数十亿人口,同时也是动物饲料和工业产品的重要来源。为了满足日益增长的玉米需求并应对气候变化和病虫害压力带来的挑战,持续改良玉米品种至关重要。双单倍体(DH)育种是传统玉米育种方法的一种替代方案,能够在两代内快速获得纯合系。尽管DH技术具有加速育种进程的潜力,但单倍体脆弱性(HF)现象成为DH技术应用的重要障碍。Chase(1964)曾假设单倍体玉米植株由于染色体数量减半,其体型会按比例缩小但仍保持相同的叶片和分枝数,然而实际观察结果与此假设相矛盾:单倍体植株不仅整体尺寸减小,叶片和分枝数也少于二倍体对照。成熟单倍体的株高约为二倍体的70%,叶面积约为56%,这些发现首次记录了单倍体脆弱性的证据。
HF表现为单倍体植株相较于同基因二倍体对照活力下降和性能劣化,限制了DH技术在育种项目中的实际应用。HF通过计算单倍体相对于二倍体性能的相对降低来量化,高HF百分比表明单倍体与二倍体性能差异显著,而负HF百分比则意味着单倍体在特定性状上表现优异,这可能是有利的。通常,更具活力的单倍体有助于充分利用DH技术,确保从初始单倍体(D0)植株成功产生DH(D1)系,这是成功生产DH系的限制因素。此外,若能在D0植株上生产更多种子,将允许进行早期自身表现测验和测交种子生产,从而加速育种过程。
近期两项研究阐明了单倍体生物学的互补方面。Fakude等(2025)证明自发单倍体基因组加倍(SHGD)可通过恢复单倍体育性替代秋水仙碱处理,他们利用BS39衍生的单倍体同基因系定位了与单倍体雌性育性(HFF)和单倍体雄性育性(HMF)相关的位点,并鉴定了与细胞骨架动力学、细胞周期调控和激素信号传导相关的候选基因。与此同时,Yavuz等(2025)量化了八个农艺性状的单倍体脆弱性,估计了性状遗传力,并显示qshgd1位点可降低脆弱性并增强活力,从而强调了SHGD在恢复活力中的作用。这些研究共同揭示了通过SHGD恢复育性和改善活力的遗传基础,但未将脆弱性、育性、全基因组关联和候选基因搜索整合到一个框架中。
本研究直接在此基础上展开,旨在提供表型和遗传学发现,以克服单倍体脆弱性并提高DH育种效率。利用Yavuz等(2025)相同的192个单倍体同基因系(HILs)及其对应的192个同基因自交系群体,本研究(i)量化了八个农艺性状的单倍体脆弱性,鉴定出具有意外高活力的单倍体系,尤其在株高和穗位高上;(ii)测试了二倍体性能、单倍体性能和HF%之间的相关性以评估预测关系;(iii)评估了脆弱性性状与HFF/HMF的关联,以确定单倍体活力是否与单倍体育性恢复相关;(iv)对二倍体、单倍体和HF%进行了全面的GWAS,随后进行候选基因分析。通过在同一群体中结合单倍体脆弱性的表型评估、育性评估和关联作图,本研究代表了玉米单倍体脆弱性和育性的首次全面分析。

材料与方法

植物材料

BS39群体源自五个外来Tusón accession,并通过数代互交适应美国中西部光周期条件。BS39-SHGD-DH系来自BS39与自交系A427的杂交,A427(约78% HMF)作为SHGD供体。BS39和BS39-SHGD衍生的DH系均通过测序基因分型(GBS)进行基因分型。2022年夏季,我们诱导了228个自交系,其中85个来自原始BS39群体(BS39-inbreds),143个来自BS39与SHGD供体自交系A427的杂交(BS39-SHGD-inbreds)。将228个自交系与诱导系(BHI306)杂交以产生单倍体种子。收获后,基于胚胎和糊粉层中R1-Navajo的表达手动进行单倍体选择,最终从228个自交系中获得192个单倍体同基因系(HILs),包括66个BS39-HILs和126个BS39-SHGD-HILs。

实验设计

2023年夏季,将192个HILs与其对应的192个同基因自交系并排种植。实验采用随机完全区组设计,每行播种20粒种子,行内间距10 cm,行间间距0.7 m。该实验设置两个重复(REP1和REP2),REP1比REP2早播种11天,地点位于美国爱荷华州布恩农业工程与农学研究农场。尽管在同一物理地点进行,11天的播种间隔使两个重复在关键生长阶段暴露于不同条件,形成了不同的时间环境。因此,在计算BLUEs和后续GWAS时,将REP1和REP2视为两个环境。在生长期间,从V2到V6生长期识别并移除了误分类的单倍体(即杂交种),分类基于视觉外观,特别是与真正单倍体典型的短小、窄且直立叶片形态相比的增强活力和更大植株与叶片大小。

表型数据采集

评估了八个农艺性状:株高(PH)、穗位高(EH)、茎粗(SD)、旗叶长(FLL)、旗叶宽(FLW)、雄穗长(TL)、穗长(SL)和雄穗分枝数(TB),同时包括单倍体雌性育性(HFF)和单倍体雄性育性(HMF)。这些性状捕获了营养活力、冠层结构、生殖潜力和育性的关键方面。数据收集遵循玉米手册中概述的标准化方案。每个性状的单倍体脆弱性计算为单倍体性能相对于同基因二倍体对照的相对降低,例如株高的单倍体脆弱性计算公式为:百分比单倍体脆弱性(株高)=[(二倍体株高 - 单倍体株高)/二倍体株高]×100。该方法类似应用于其他性状,从而量化相对于二倍体的性状特异性单倍体性能降低。
对二倍体和单倍体系均进行了性状测量。株高在VT和R1期从地面到雄穗顶端用测量尺测量;穗位高在VT和R1期从地面到穗基部用卷尺测量;茎粗在R2期用卡尺在从底部数第二节间测量;旗叶长在R2期从叶颈到叶尖用卷尺测量;旗叶宽在R2期在叶片最宽点用卷尺测量;雄穗长在R2期从基部到雄穗顶端用卷尺测量;穗长在R2期从基部到穗尖测量;雄穗分枝数在R1期通过记录从中央穗出现的侧枝数量计数。
单倍体雄性育性(HMF)百分比数据在开花期收集,计算公式为HMF(%)= [花粉脱落单倍体数量 / 总单倍体数量] ×100。单倍体雌性育性(HFF)数据在收获时计数记录,作为每小区平均籽粒数,并根据最终植株数调整,计算为平均HFF = [每小区籽粒数 / 每小区总单倍体数]。

表型数据的统计分析

使用R中lme4包为所有八个性状拟合线性模型:Yij = μ + Gi + Ej + εij,其中Yij是在第i个基因型(i=1,2,…,192)和第j个环境(j=1,2)上观察到的二倍体性能、单倍体性能和(计算出的)单倍体脆弱性百分比,μ是总体均值,Gi是第i个基因型的固定效应,Ej是第j个环境的固定效应,εij是随机误差。使用Shapiro-Wilk检验评估计算出的单倍体脆弱性、单倍体性能和二倍体性能数据的正态性违例,当p值<0.05时,使用R中bestNormalize包对性状进行转换。计算出的单倍体脆弱性进行方差分析(ANOVA)前对性状进行转换。所有八个性状的数据均进行了转换,因为其分布不服从正态分布。
基于条目均值的八个性状遗传力计算为h2 = σg2 / (σg2 + σe2/n),其中σg2是遗传方差分量,σe2是随机误差的方差分量,n为2。二倍体水平、单倍体水平和单倍体脆弱性百分比上遗传力估计值低的性状被排除在相关性计算之外。因此,二倍体和单倍体(D-H)之间的相关性仅针对七个性状进行,排除茎粗。单倍体与单倍体脆弱性(H-HF)以及二倍体与单倍体脆弱性(D-HF)之间的相关性针对四个性状计算,排除茎粗、旗叶长、旗叶宽和雄穗分枝数。鉴于单倍体雄性育性和单倍体雌性育性在DH生产中的关键作用,我们进一步探讨了它们与本研究中检查的八个农艺性状的相关性。因此,计算了包括HMF、HFF以及八个性状在二倍体和单倍体水平及其单倍体脆弱性百分比的相关性矩阵。所有相关性均使用R中的Spearman相关性计算。使用两个重复的合并数据,在R中使用lme4包计算二倍体性能、单倍体性能和单倍体脆弱性百分比的最佳线性无偏估计量(BLUEs),这些BLUEs作为全基因组关联研究(GWAS)的表型数据。

基因组预测

将192个基因型分为训练集和测试集。训练集中二倍体的农艺性状用于校准基因组预测模型。预测能力是测试集中二倍体和单倍体性状预测值与BLUEs的Pearson相关系数,通过五次重复的五折交叉验证平均估计。

基因组预测模型

使用岭回归BLUP(rrBLUP)构建预测模型,通过R中rrBLUP包执行。通过估计全基因组SNP效应生成预测,模型表示为y = μ + Zu + ε,其中y是单个性状BLUE值的向量,μ是总体均值,Z是全基因组SNP基因型的关联矩阵,u是随机SNP效应向量,假设u ~ N(0, Iσm2),其中I是单位矩阵,σm2是SNP标记方差。残差误差向量ε遵循ε ~ N(0, Iσe2)。

基因分型和SNP calling

基因分型和SNP calling先前由Verzegnazzi等(2021)和Santos等(2022)完成。对471个系(包括153个BS39-DHs和318个BS39-SHGD-DHs)进行了基因分型测序(GBS),共产生955,690个SNPs。本研究从这471个系的更大数据集中采样了192个DH系的基因型数据。使用TASSEL 5.2.58过滤SNP数据,排除次要等位基因频率(MAF)低于5%和调用率低于50%的SNPs,同时丢弃杂合度超过5%的系,任何剩余的杂合位点视为缺失数据。应用这些过滤标准后,为用于基因分型192个HILs的66个BS39-DHs和126个BS39-SHGD-DHs保留了414,337个SNPs。所选SNPs被注释以代表相应的染色体编号和碱基对位置。

连锁不平衡和主成分分析

使用R软件中GAPIT包进行连锁不平衡衰减、亲缘关系和主成分分析。使用等位基因的平方相关系数(R2)值量化全基因组LD,以深入了解不同位点等位基因的非随机关联。使用GAPIT中VanRaden方法计算亲缘关系矩阵。进行主成分分析(PCA)以考虑群体结构、相关性和维度,通过对基因型数据矩阵执行PCA,GAPIT识别了遗传变异的主要轴,由主成分(PCs)表示,这些PCs捕获了群体内遗传多样性的不同模式。解释最多遗传变异的前三个PCs被解释为群体结构的指标,这些PCs作为后续关联作图分析中的协变量。

全基因组关联作图

使用GAPIT进行SNP基因型标记与二倍体、单倍体农艺性状及单倍体脆弱性百分比之间的关联。仅对方差分析(ANOVA)中显示显著遗传变异的性状进行关联作图。选择FarmCPU基于其整合遗传相关性作为随机效应以解释群体结构的能力。使用Simple-M方法进行多重假设校正以控制家族错误率,Simple-M通过考虑SNPs之间的连锁不平衡来估计独立测试的有效数量,提供比传统Bonferroni校正更宽松的调整显著性阈值。

潜在候选基因的定位

对具有高度显著SNPs和跨二倍体、单倍体及单倍体脆弱性百分比重叠SNPs的农艺性状进行候选基因搜索。在稳定QTL位点上下游200 kb区域内鉴定候选基因,利用MaizeGDB中B73 RefGen_v5参考基因组。为将使用B73v2参考基因组开发的SNP数据与更新的B73v5参考基因组对齐,对每个SNP侧翼区域进行了坐标转换,考虑每个SNP上下游约200 kb。转换过程涉及识别B73v2基因组中每个200 kb片段边界的基因,并确认其在B73v5基因组中的更新位置,从而基于这些边界基因在新基因组版本中的位置偏移准确定义SNP侧翼区域。直接位于或接近每个关联SNP的基因被视为性状的可能候选基因。

结果

单倍体、二倍体和单倍体脆弱性百分比的性状分布

箱线图揭示了不同农艺性状的二倍体性能、单倍体性能和单倍体脆弱性百分比之间存在不同程度的重叠。例如,二倍体株高中位数约为190 cm,而单倍体降低至约140 cm,但四分位距(IQR)重叠表明某些单倍体个体达到了相似高度。穗位高也观察到类似模式,二倍体中位数高于70 cm,单倍体约为40 cm,但IQR重叠表明一些单倍体达到了可比高度。茎粗方面,二倍体中位数约为3 cm,虽然单倍体通常茎更细(2 cm),但存在重叠表明一些单倍体达到近二倍体厚度。旗叶长、旗叶宽、雄穗长、穗长和雄穗分枝数也呈现一致模式,二倍体通常优于单倍体,但IQR重叠暗示并非所有单倍体同样脆弱。值得注意的是,雄穗分枝数显示最高重叠,二倍体中位数为18个分枝,单倍体为17个分枝。

农艺性状的统计摘要和遗传力

二倍体平均株高188.7 cm,最大291.7 cm;单倍体平均较低,为139.4 cm,最大200.8 cm。该趋势与其他性状一致,如穗位高:二倍体平均72.4 cm,单倍体43.9 cm;茎粗:二倍体4.8 cm,单倍体4.1 cm。单倍体脆弱性百分比普遍反映这些降低,株高平均单倍体脆弱性30%,穗位高40%,表明单倍体性能显著下降。然而,雄穗分枝数在单倍体和二倍体中相似(15.6和16.8),单倍体脆弱性百分比范围从最低-60%到40%。
不同性状的遗传力揭示了二倍体性能、单倍体性能和单倍体脆弱性百分比的 distinct 趋势。二倍体始终表现出最高遗传力,所有性状值范围0.8-0.9,除茎粗(0.2)外。相比之下,单倍体通常显示略低于二倍体的遗传力,值范围0.7-0.9,除茎粗(0.1)外。单倍体脆弱性始终显示最低遗传力估计值,与二倍体和单倍体相比,株高、穗位高和穗长值0.6-0.7,茎粗、旗叶长、旗叶宽、雄穗长和雄穗分枝数0.1-0.3。总体而言,单倍体和二倍体茎粗,以及单倍体脆弱性茎粗、旗叶长、旗叶宽、雄穗长和雄穗分枝数表现出低遗传力且无遗传变异,因此被排除在进一步分析之外。

株高和穗位高中表现出高和低单倍体脆弱性的二倍体-单倍体对

田间观察清楚显示了同基因二倍体-单倍体对间单倍体脆弱性的变异性。Panel A显示了代表性对,其中单倍体始终比二倍体对照 shorter 和 weaker,展示了高脆弱性案例。相反,Panel B突出了 exceptional 对,其中单倍体达到与二倍体相当的身材,表明微弱或不存在脆弱性。
定量分析支持这些观察。株高方面,单倍体脆弱性百分比(HF_PH)范围0.45-0.77,SHGD_DH_211对显示最高脆弱性(HF_PH=0.77)。类似地,穗位高方面,单倍体脆弱性值(HF_EH)范围0.71-0.86,再次SHGD_DH_211显示最高脆弱性(HF_EH=0.86)。相比之下,某些对中观察到微弱或不存在脆弱性。株高方面,SHGD_DH_045和SHGD_DH_053显示HF_PH值-0.02和0.02,表明单倍体和二倍体之间差异可忽略。穗位高方面,SHGD_DH_046显示负HF_EH值(-0.04),反映单倍体匹配或略优于二倍体。

单倍体性能、二倍体性能和单倍体脆弱性百分比之间的相关性

二倍体性能、单倍体性能和单倍体脆弱性百分比之间的相关性分析揭示了强度 varying 的显著关系。二倍体和单倍体性能之间的相关性通常为正,范围从雄穗长的0.6到雄穗分枝数的0.9。单倍体性能与HF值之间的相关性为负,范围-0.4到-0.6。二倍体性能与HF百分比之间的相关性通常较弱且为正(0.1-0.4),针对分析的四个性状。由于低遗传力估计和缺乏遗传变异,排除茎粗、旗叶长、旗叶宽和雄穗分枝数的单倍体性能与单倍体脆弱性;以及二倍体与单倍体脆弱性的相关性分析。

单倍体雌性育性、单倍体雄性育性与农艺性状和单倍体脆弱性百分比的相关性

图示了单倍体雄性育性、单倍体雌性育性与二倍体、单倍体及单倍体脆弱性百分比农艺性状之间的关系。单倍体雄性育性显示与单倍体旗叶长和二倍体旗叶长相关性0.3,与二倍体穗长、雄穗长和雄穗分枝数相关性0.2。单倍体雌性育性表现出略强于单倍体雄性育性的相关性,与单倍体旗叶长、旗叶宽、穗长和雄穗长相关性0.4,与二倍体旗叶宽相关性0.3。

二倍体对单倍体和单倍体脆弱性百分比的预测能力

显示了二倍体对单倍体性能和单倍体脆弱性 across 七个农艺性状的预测能力。二倍体通常对大多数单倍体性状显示中等预测能力(0.3-0.5),表明二倍体性能可提供一些单倍体性能的洞察。然而,对单倍体脆弱性的预测能力较弱,特别是旗叶长、旗叶宽和穗长,值接近零。

单倍体性能、二倍体性能和单倍体脆弱性百分比的关联作图

全基因组关联分析揭示了农艺性状的二倍体性能、单倍体性能和单倍体脆弱性的 distinct SNP关联。株高方面,染色体3和10上鉴定到二倍体性能显著位点,染色体2和3上单倍体,染色体1和8上单倍体脆弱性。穗位高方面,染色体3和8上检测到12个SNPs用于二倍体性能,而染色体1,2,3,4,5,8和10上检测到15个SNPs用于单倍体性能,染色体1(P=1×10-15)和染色体2(P=1×10-12)上具有高度显著关联用于单倍体性能。染色体4,9和10上三个SNPs与单倍体脆弱性穗位高相关。
旗叶性状显示多重关联:二倍体旗叶长13个SNPs(染色体1,3,6,7)和单倍体七个SNPs(染色体1,2,7)。单倍体旗叶宽与七个染色体上17个SNPs强烈关联,包括染色体3上高度显著位点(P=1×10-12),而二倍体仅显示两个SNPs(染色体1,6)。穗长方面,二倍体鉴定一个SNP(染色体9),单倍体脆弱性一个SNP(染色体4),而单倍体性能无显著关联。雄穗性状 exhibited 更广泛关联:二倍体雄穗长与10个SNPs linked(染色体2,4),单倍体雄穗长与六个SNPs(染色体1,6),单倍体脆弱性与七个SNPs(染色体1,4,5,7,9)。雄穗分枝数方面,三个SNPs与二倍体性能相关(染色体5),三个与单倍体性能相关(染色体1,5,8),包括染色体5上共享SNP。总体而言,仅一个SNP在单倍体和二倍体雄穗分枝数之间重叠。任何评估性状中,二倍体性能与单倍体脆弱性之间或无SNPs常见,单倍体性能与单倍体脆弱性之间也无。

高度显著SNPs和跨单倍体与二倍体重叠SNPs的候选基因定位

鉴定出几个候选基因与单倍体性能高度显著SNPs和跨单倍体性能与二倍体性能常见SNPs处于LD中。雄穗分枝数方面,鉴定出一个跨单倍体性能与二倍体性能的常见SNP。染色体5上SNP S5_135455228与Zm00001eb237460处于LD,编码Myb相关蛋白3R-1。染色体5上高度显著SNP(S5_60244705)与Zm00001eb227800相关,编码Protein SHI RELATED SEQUENCE 1。两个SNPs与穗位高相关。染色体1上SNP S1_267783859与Zm00001eb054870 linked,编码SAUR-like生长素响应蛋白;染色体2上SNP S2_197433320与Zm00001eb104060相关,编码PRONE结构域包含蛋白。一个候选基因与单倍体旗叶宽性能关联SNPs处于LD,染色体3上SNP S3_6432571紧邻Zm00001eb121230,编码Homogentisate geranylgeranyl transferase1。

讨论

历史视角与近期研究

单倍体脆弱性(HF)概念首次由Chase(1964)描述,他观察到玉米单倍体比“单倍体-二倍体比率”模型预期更小且活力更低,这项基础工作确立脆弱性作为生物学约束而非简单缩放效应。最近,Yavuz等(2025)在BS39衍生群体中量化了HF,并报告qshgd1位点降低多性状脆弱性,确认HF既遗传可变又可遗传。并行地,Fakude等(2025)在BS39衍生单倍体同基因系中调查了单倍体育性,显示单倍体雄性育性和单倍体雌性育性是遗传独立性状,各自具有 distinct 遗传架构。这些研究共同澄清了HF的遗传力以及单倍体育性的遗传独立性。
我们的研究通过整合单倍体脆弱性、单倍体活力和单倍体育性性状与相关性分析、基因组预测和全基因组关联分析扩展这些发现。我们聚焦于新颖之处:鉴定活力单倍体(负脆弱性案例)、连接单倍体活力与单倍体育性的相关性,以及发现提供单倍体生物学功能洞察的单倍体特异性位点和候选基因。重要的是,本研究还评估了育种既活力又育性的单倍体的可能性,若实现,可能变革双单倍体育种策略。

单倍体脆弱性的新颖洞察

与Chase(1964)和Yavuz等(2025)一致,我们研究中单倍体 exhibited 株高和穗位高相较于二倍体降低30-40%。然而,我们也检测到具有微弱甚至负脆弱性的性状,如旗叶宽和雄穗分枝数,其中单倍体有时等于或优于二倍体。这些观察表明脆弱性是性状特异且可变的,为选择固有活力单倍体打开机会。值得注意的是,遗传力估计确认HF非纯环境:株高、穗位高和穗长值0.6-0.7支持单倍体活力遗传改良的可行性。

低遗传力性状从进一步分析中排除

评估了所有八个性状的遗传力和遗传方差。由于低方差和遗传力,茎粗在二倍体和单倍体中被排除,这可能反映其发育可塑性和高环境敏感性。因为单倍体脆弱性源自
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号