利用基因型主成分评分作为大豆农艺性状全基因组与上位性分析中的潜在表型:揭示基因-环境互作下的新数量性状位点

【字体: 时间:2025年09月25日 来源:Canadian Journal of Plant Science 1

编辑推荐:

  本综述系统探讨了将基因型主成分评分(gPCs)作为潜在表型应用于大豆(Glycine max L. Merr.)农艺性状全基因组关联分析(GWAS)及上位性分析的新策略。研究通过GGEbiplot对多年多地点数据进行降维处理,成功鉴定出传统表型分析未能检测到的关键数量性状位点(QTL),涉及成熟期、籽粒含油量、产量及株高等性状。该方法有效克服了基因型与环境互作(G×E)的干扰,并利用上位性分析揭示了控制籽粒油分与蛋白含量的基因网络,为大豆分子设计育种提供了新视角。

  

Abstract

研究通过基因型主成分评分(gPCs)作为潜在表型,在大豆农艺性状的全基因组关联分析(GWAS)和上位性分析中挖掘传统方法难以检测的标记-性状关联(MTAs)。利用GGEbiplot对多年多地点数据进行分析,成功在成熟期、籽粒含油量、产量和株高等性状中鉴定出新的数量性状位点(QTL),其中包括已知的E1和E3成熟期基因座。上位性分析进一步揭示了控制油分和蛋白含量的互作位点,为解析多基因调控网络提供了新见解。

Introduction

大豆(Glycine max L. Merr.)是全球重要的粮食和经济作物,其产量和品质性状受到基因型与环境互作(G×E)的显著影响。全基因组关联分析(GWAS)是解析复杂性状遗传基础的有效手段,但常受群体结构和环境变异干扰。主成分分析(PCA)可通过降维提取遗传变异的核心信息,近年已在水稻、玉米等作物中成功应用。本研究创新性地将基因型主成分评分(gPCs)作为潜在表型引入GWAS,旨在挖掘大豆农艺性状的隐蔽遗传位点,并通过上位性分析揭示基因互作网络。

Materials and methods

Original GWAS data

采用Sonah等(2015)报道的139份基因型在三个地点两个生长季的农艺性状数据,该群体此前已被用于氮固定、抗逆性等多性状研究。

Calculation of gPCs

使用GGEbiplot软件生成六个主成分(PCs),通过奇异值分解同时分析基因型和环境因子,获得各基因型的gPC评分作为GWAS输入表型。

GWAS analysis of gPCs

基于155,617个SNP标记,采用rMVP和GAPIT软件包运行GLM、MLM、MLMM和FarmCPU四种模型。显著性阈值设为p≤10?5.5,并利用PCA协变量和亲缘关系矩阵控制假阳性。

Epistatic analysis of gPC GWAS loci

通过PLINK对显著SNP进行"set-by-all"上位性检测,采用Bonferroni校正(α=0.05)筛选互作位点。

Linkage disequilibrium and haplotype block analysis

使用TASSEL5和Haploview计算连锁不平衡(LD)及单倍型区块,以半衰距离(HDD)为界定义候选区间。

ASE and PVE

计算等位基因替代效应(ASE)和表型变异解释率(PVE),对上位性位点按四类等位基因组合评估效应。

Candidate gene analysis

通过Soybase和文献检索共定位已知QTL,利用Phytozome和NCBI保守域数据库(CDD)预测基因功能,REVIGO进行GO富集分析,并参照拟南芥同源基因验证候选基因。

Results

Principal component analysis

GGEbiplot生成的六个PCs中,PC1对多数性状解释率最高(如株高69.5%,蛋白含量82.5%),但PC2(成熟期)和PC4(株高)也检测到微效位点。

GWAS analysis

共发现22个显著MTAs,涉及17个SNP和10条染色体。例如PC1蛋白含量在Gm20上检测到Prot-20-PC1-5位点,其附近存在17个已知QTL(图1)。

Epistatic analysis

籽粒油分和蛋白含量分别检测到61和52个上位性互作, consolidated后得到57个上位性QTL,分布于14条染色体(附表S2)。其他性状未发现显著互作。

Haplotype block analysis

染色体LD半衰距离(HDD)平均为842 Kbp,单倍型区块大小6-1503 Kbp(平均440 Kbp)。如图3所示,Gm5上Mat-5-PC1-1/Yld-5-PC1-1区块通过solid-spine法界定。

ASE and PVE

gPC QTL的ASE效应在原始表型和gPC评分中均得到验证。上位性位点中,双minor基因型组合对蛋白含量的PVE最高达12.3%(附表S1-S2)。

Proximal QTL

多数gPC QTL与已知位点共定位(如E1、E3成熟期基因座),但Plht-19-PC1-2等4个位点为首次报道(表1)。

Short list of QTL

基于PVE和ASE筛选出6个核心QTL(表2)和2个上位性热点(PO-2-Epi-4和PO-10-Epi-29)(表3),其等位基因替代可导致显著表型变化(如成熟期差异4.8天,产量波动323 kg/ha)。

Candidate genes for control of agronomic traits

在候选区间内发现15个基因和1个基因簇可能调控目标性状。例如Gm14上的Glyma.14G001600具有PB1_NLP和RWP-RK结构域,其拟南芥同源基因AT4G38340参与硝酸盐响应;Gm19上Glyma.19g224200(E3基因)与检测位点仅距2 Kbp。GO富集显示这些基因显著参与氮代谢、光周期调控等生物学过程(图S5,表S4-S7)。

Discussion

研究证实gPCs作为潜在表型可有效整合G×E效应,突破传统GWAS的局限性。与Neupane(2022)在小豆、Rice(2020)在玉米中的研究一致,PC1主导但高阶PCs(如PC4)也能检测微效位点。上位性分析仅针对gPC衍生SNP集进行,虽发现油分蛋白的互作网络,但可能遗漏其他性状的 epistasis。与Sonah(2015)原研究对比,gPC方法复现了E1、E3等已知位点,且新发现Mat-5-PC1-1/Yld-5-PC1-1等增产位点,但未能检测Gm2和Gm13上的粒重QTL,表明该方法对低遗传力性状仍存在局限。该方法在降维的同时保留G×E信息,但线性PCA可能忽略非线性互作。未来可结合多组学数据深化候选基因功能验证,推动大豆分子育种实践。

Acknowledgements

感谢加拿大农业与农业食品部、加拿大田间作物研究联盟(CFCRA)及卡尔顿大学的资金支持,以及所有合作团队的技术协助。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号