编辑推荐:
针对燕麦产量遗传改良低效难题,研究人员利用南达科他州立大学燕麦育种数据,通过全基因组关联分析(GWAS)筛选与产量及株高、抽穗期等性状相关的 38 个基因组区域。虽固定效应模型未提升预测精度,但仅用关联标记建模使准确率提高 4–6%,为燕麦育种提供新策略。
燕麦作为全球第七大谷物,兼具粮食、饲料和覆盖作物用途,其 β- 葡聚糖成分对人体心血管和代谢健康有益。然而,自 1960 年以来,全球燕麦种植面积和产量持续下降,且其籽粒产量遗传增益显著低于玉米、小麦等作物。这一困境源于产量性状的遗传复杂性及与环境的强互作效应,导致传统育种难以高效改良。因此,解析燕麦产量相关的基因组区域并优化基因组预测模型,成为突破产量瓶颈的关键方向。
南达科他州立大学(South Dakota State University, SDSU)与美国农业部农业研究服务局(USDA-ARS)的研究团队,针对这一挑战开展了系统研究。他们利用 2015 至 2022 年间 6 个育种群体、26 个环境(年份 - 地点组合)的 1281 份燕麦品系数据,结合全基因组关联分析(GWAS)和基因组预测(GP)模型,旨在挖掘与产量及相关性状(株高、抽穗期、倒伏、茎秆弹性、冠锈病严重度)关联的遗传标记,并评估其对预测精度的提升潜力。研究成果发表于《Euphytica》,为燕麦分子育种提供了重要理论支撑。
关键技术方法
- 表型数据采集:在南达科他州多个试验点,对籽粒产量(kg/ha)、株高(PHT,cm)、抽穗期(HDT,天)等 6 个性状进行多年多环境测定,采用最佳线性无偏估计(BLUEs)校正环境效应。
- 基因型分析:利用简化基因组测序(GBS)技术,对育种材料进行基因分型,获得 38,070 个单核苷酸多态性(SNP)标记,经过滤和填充后用于后续分析。
- 全基因组关联分析(GWAS):通过 GAPIT R 包的 BLINK 模型,校正群体结构(主成分分析),识别与性状显著关联的 SNP 标记,结合连锁不平衡(LD)分析划定基因组区域。
- 基因组预测模型:基于线性混合模型,比较包含全标记(MS1)、关联标记(MS2)、区域标记(MS3)的随机效应模型,及固定效应模型对产量预测的准确性。
研究结果
1. 表型变异与性状关联
- 环境影响显著:籽粒产量在不同环境间差异悬殊,2021 年因干旱导致产量显著降低,株高和抽穗期也受气候影响。冠锈病严重度(CRS)在部分环境中与产量呈强负相关,表明抗病性对产量形成的重要性。
- 性状相关性动态变化:主成分分析(PCA)显示,产量与抽穗期的相关性随年份波动,2021 年干旱条件下晚熟品系产量更高,体现环境对遗传效应的修饰作用。
2. 基因组区域识别
- 多性状关联标记:通过 GWAS 鉴定出 193 个显著 SNP,归为 76 个基因组区域,进一步过滤得到 38 个核心区域(含 153 个 SNP),分布于 18 条染色体。其中,7D 染色体上的 Schr7D_508618782 标记与产量、冠锈病抗性、株高和抽穗期均相关,显示多效性或紧密连锁效应。
- 已知与新发现区域:约半数区域为已知位点(如 7D 染色体的冠锈病抗性基因 Pc 系列),部分 A 基因组区域为首次报道,尤其与茎秆弹性(SPK)相关的标记,填补了该性状研究空白。
3. 基因组预测优化
- 固定效应模型无效:将显著标记作为固定效应纳入模型(GPM2-GPM4),未提升产量预测准确性,可能因产量遗传结构复杂,单一位点效应不足以解释表型变异。
- 标记子集优化有效:仅使用关联标记(MS2,132 个 SNP)的模型较全标记模型(MS1)预测准确率提高 4–6%,表明关键标记可有效捕获产量相关遗传变异,减少冗余标记干扰。
结论与意义
本研究通过多环境 GWAS 揭示了燕麦产量及相关性状的复杂遗传结构,鉴定出 38 个核心基因组区域,其中 7D 染色体的多效性区域为抗病与高产协同改良提供了靶点。尽管固定效应模型未达预期,标记子集优化策略显著提升了基因组预测效率,为分子标记辅助选择(MAS)与基因组选择(GS)的结合应用奠定了基础。研究结果不仅加深了对燕麦产量遗传机制的理解,也为其他复杂性状作物的育种提供了方法论参考,助力应对全球粮食安全与气候变化挑战。