大麦表型稳定性的全基因组关联分析与预测:应对气候变化的遗传育种策略

【字体: 时间:2025年09月28日 来源:The Plant Genome 3.8

编辑推荐:

  本研究通过多环境试验,系统解析大麦农艺和品质性状表型稳定性(即线性可塑性,slope)的遗传架构,发现其与性状本身均值存在共享遗传控制,并证明基因组预测(GP)可有效筛选稳定性基因型,为气候变化下作物稳产育种提供了新策略。

  

2 方法与材料

2.1 植物材料、标记基因分型与表型分析

研究利用来自北美五个育种项目的182个创始群体(FP)品系和50个后代群体(OP)品系组成的233个大麦品系面板。该面板在2014年至2017年间于42个地点-年份环境中进行表型鉴定,环境覆盖美国北部和加拿大南部。测定了五个关键农艺和麦芽品质性状:籽粒蛋白质含量(GP,% w/w)、籽粒产量(GY,kg ha?1)、抽穗期(HD,播种后天数)、株高(PH,cm)和容重(TW,g L?1)。不同性状的环境数量有所不同,GP为15个,GY为40个,HD为37个,PH为39个,TW为20个。
基因分型采用基因分型测序(GBS)技术。经过质量控制、过滤和基因型填补后,保留了6361个高质量SNP标记,用于构建加性关系矩阵(K)。此外,从Triticeae Toolbox(T3)数据库下载了基于iSelect 9K大麦SNP芯片的8288个标记基因型,并与GBS数据集合并。最终用于关联分析的标记数据集包含5223个SNP,对应179个FP品系。

2.2 表型分析

采用两阶段方法进行表型数据分析。第一阶段,在每个环境中计算调整后的基因型均值。第二阶段,使用Finlay和Wilkinson的联合回归模型估算线性可塑性(斜率,bi)和非线性可塑性(偏差,σδ(i))。通过混合模型估计基因组狭义遗传力(HSNP)和遗传相关性。此外,通过环境重采样实验(从总环境中抽取10%至90%),评估环境数量对参数估计和预测准确性的影响。

2.3 全基因组关联分析

使用FarmCPU方法进行多基因座混合模型关联分析,检测与基因型均值、斜率和偏差相关的标记-性状关联(MTA)。分析中使用了0至3个主成分(PC)来控制群体结构。显著性阈值设定为错误发现率(FDR)<0.10。通过4.5 Mb的窗口(约3 cM)定义基因组区域,并与已知QTL和基因进行比较。

2.4 全基因组预测

使用基因组最佳线性无偏预测(GBLUP)模型评估基因型均值、斜率和偏差的预测准确性。采用两种验证方法:FP内的五折交叉验证和FP训练、OP测试的代间预测。预测准确性(rMP)定义为预测值与观测值之间的相关性。

2.5 数据可用性

本研究所用的表型和基因型数据可在T3数据库(https://triticeaetoolbox.org/barley/)中获取,分析代码保存在GitHub仓库(https://github.com/UMN-BarleyOatSilphium/S2MET_StabilityMapping)。

3 结果

3.1 表型可塑性

所有性状在基因型-环境均值上均表现出显著的表型变异。斜率和偏差参数的方差分量均高度显著(p < 1×10?16)。斜率估计值的分布范围约为0.60至1.3,其中GP和TW的范围更宽(0.40至1.5)。基因型均值与斜率参数之间的表型相关性范围为-0.18至0.37,而基因型均值与偏差参数无相关性。
基因组回归模型显示,基因型均值和斜率参数具有中等到高的遗传力。基因型均值的HSNP估计值范围为0.57(PH)至0.82(HD),斜率的HSNP范围为0.35(TW)至0.66(GP),而偏差参数无遗传力。双变量混合模型得到的基因型均值与斜率之间的遗传相关估计值与表型相关大致相等。

3.2 标记-性状关联

共检测到87个显著的MTA,涉及基因型均值、斜率和偏差。几乎所有性状均在基因型均值和斜率参数上检测到显著关联,而偏差参数仅TW检测到两个关联。许多显著MTA与已知QTL或基因重合,例如GP斜率关联与HvNAM-1和HvDEP1基因重合,GY均值与斜率关联与Vrn-H2基因重合,多个性状的关联集中在7号染色体上的Vrn-H3基因区域。
环境重采样实验显示,随着采样环境比例的增加,参数估计的均方误差减小,MTA发现率增加。采样约30%–40%的环境后,误差减少的边际效益下降。对于某些性状,针对环境均值分布特定分位数(如上50%、下50%)采样可进一步提高斜率参数估计的准确性。

3.3 全基因组预测

GBLUP模型的预测准确性中等到高。FP内交叉验证中,基因型均值的平均预测准确性范围为0.46(TW)至0.84(HD),斜率的准确性范围为0.32(TW)至0.69(GP)。偏差参数的预测不准确。代间预测中,基因型均值的准确性范围为0.56(GP)至0.63(GY、PH、TW),斜率的准确性范围为0.26(PH)至0.61(GP)。
环境重采样分析表明,使用较少的环境即可获得较高的预测准确性。例如,采样10%(HD和PH)至30%(TW)的环境即可使基因型均值的预测准确性达到全数据集的80%以上,采样20%(PH)至60%(HD、TW)的环境可使斜率参数的预测达到类似准确性。

4 讨论

4.1 遗传架构的复杂性与重叠性

结果表明,表型稳定性/可塑性的遗传架构与性状本身均值同样复杂。基因型均值和斜率参数的基因组狭义遗传力中等到高,且存在相关性。偏差参数遗传力低,可能与线性可塑性在解释GEI中的主导作用或其作为回归残差的统计性质有关。
关联分析检测到多个显著位点,但每个位点解释的方差比例较小,表明遗传架构复杂。基因型均值与斜率之间的遗传相关性中等,表明存在共享遗传架构,可能是由于多效性或连锁不平衡(LD)。几乎所有斜率关联均与先前发现的相同性状的均值QTL重合,进一步支持等位基因敏感性模型。

4.2 表型可塑性的准确全基因组预测

全基因组预测在群体内和代间均表现出中等到高的准确性,表明可用于早期选择稳定基因型。代间预测准确性的下降可能与亲缘关系降低或重组导致的LD变化有关。环境重采样结果显示,使用较少环境即可获得有用的预测准确性,这有助于降低多环境试验的成本。

4.3 对育种应对气候变化的启示

开发耐受极端环境条件且表型稳定的作物品种对于应对气候变化至关重要。Finlay-Wilkinson方法通过回归表型值到环境均值来测量可塑性,假定整体可塑性对应于特定 abiotic 胁迫(如高温或干旱)下的可塑性。未来研究可结合明确的环境信息(如温度、降雨量)来解析可塑性对特定胁迫的反应。
遗传架构的重叠表明存在多效性,可能同时改善性状均值和可塑性带来挑战,但通过利用有利的相关性和LD,以及打破不利连锁,仍可实现遗传增益。选择指数和基于预测方差协方差的选择方法可用于联合改良性状均值和可塑性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号