编辑推荐:
在大豆研究中,基因型与环境互作常干扰农艺性状标记 - 性状关联(MTAs)的鉴定。研究人员开展用基因型主成分得分(gPCs)作潜在表型的全基因组关联分析(GWAS)及上位性分析。发现新 QTL,明确基因网络,为育种提供资源,意义重大。
大豆,作为全球重要的农作物,不仅是人类饮食中蛋白质的关键来源,还在动物饲料领域占据重要地位,支撑着肉类、奶制品和蛋类的生产。同时,它也是植物油的重要供应源,广泛应用于食品、燃料和工业等多个领域。随着全球人口预计在 2050 年达到 97 亿,确保大豆等优质蛋白的稳定供应,成为保障全球粮食安全的关键任务。
然而,在大豆的种植和培育过程中,诸多问题逐渐凸显。就拿大豆的农艺性状来说,像成熟度、种子蛋白质和油含量、种子重量、株高以及产量等,这些性状受到复杂的遗传机制调控,并且极易受到环境因素的影响。其中,基因型与环境的相互作用(genotype - by - environment interactions),更是给相关研究带来了巨大挑战。传统的全基因组关联分析(Genome Wide Association Study,GWAS)在鉴定大豆农艺性状的标记 - 性状关联(Marker Trait Associations,MTAs)时,常常会受到这种相互作用的干扰,导致一些重要的遗传信息被遗漏,使得研究结果的准确性和可靠性大打折扣。
为了攻克这些难题,来自国外的研究人员开展了一项极具意义的研究。他们巧妙地运用基因型主成分得分(genotypic principal component scores,gPCs)作为潜在表型,深入进行全基因组关联分析(GWAS)以及上位性分析(Epistatic analysis)。通过这项研究,研究人员取得了一系列令人瞩目的成果。他们成功发现了多个与大豆成熟度、种子油含量、产量和株高相关的重要数量性状位点(Quantitative Trait Loci,QTL),而这些位点在以往使用传统表型的研究中并未被检测到。同时,上位性分析揭示了控制种子油和蛋白质含量的 QTL,这为深入理解控制这些多效性性状的复杂基因网络提供了新的视角。此外,研究还在大豆的六条染色体上定位了相关 QTL,并提出了 15 个基因和 1 个基因簇作为控制农艺性状的候选基因。该研究成果发表在《Canadian Journal of Plant Science》上,为大豆的遗传改良和育种工作提供了重要的理论依据和实践指导。
在研究方法上,研究人员主要运用了以下关键技术:首先,他们利用之前研究中的 139 个大豆基因型在三个地点、两个生长季节的农艺性状数据计算 gPCs,借助 GGEbiplot 软件为每个基因型和环境的每个性状生成六个主成分(PCs)。接着,使用 R 软件,结合 rMVP 和 GAPIT 等软件包,运用四种不同的模型(通用线性模型 GLM、混合线性模型 MLM、多位点混合模型 MLMM 和固定和随机模型循环概率统一 FarmCPU)对 gPCs 进行 GWAS 分析。之后,运用 PLINK 1.9 和 PLINK 1.07 软件中的 Epistasis 函数对 gPC GWAS 位点进行上位性分析。同时,通过 TASSEL 5 软件计算连锁不平衡(Linkage disequilibrium,LD),使用 Haploview 4.1 软件进行单倍型块分析,从而确定候选基因。
研究结果如下:
- 主成分分析:利用 GGEbiplot 确定了每个农艺性状的六个 PCs,通过 PCs 的平方和可判断其在 GWAS 中作为表型的有效性。
- GWAS 分析:对农艺性状的 gPCs(PC1 至 PC6)和包含 155617 个单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs)的基因分型测序(genotype - by - sequencing,GBS)数据进行 GWAS 分析,采用四种统计模型,最终在十条染色体上的 17 个显著 SNPs 和农艺性状的 gPCs 之间鉴定出 22 个显著的 MTAs。
- 上位性分析:对显著的 gPC QTL 进行上位性分析,发现种子蛋白质含量有 61 个显著的上位性相互作用,种子油含量有 52 个显著的上位性相互作用,共确定了 57 个上位性 QTL,这些相关的 SNPs 分布在 14 条染色体上。
- 单倍型块分析:计算每条染色体的 LD 并可视化,得到半衰减距离(Half Decay Distance,HDD),其范围从 Gm 11 上的 243 千碱基对(Kbp)到 Gm 19 上的 2593 Kbp,平均为 842 Kbp。确定的单倍型块大小从 Gm 4 上的 6 Kbp 到 Gm 10 上的 1503 Kbp 不等,平均为 440 Kbp ,并据此识别候选基因。
- ASE 和 PVE:计算了每个 gPC QTL 的等位基因替代效应(Allele Substitution Effect,ASE)和表型变异解释率(Percent Variance Explained,PVE),为进一步分析基因效应提供了数据支持。
- 近端 QTL:通过对近端 SNPs 和先前报道的 QTL 进行综合调查,验证了 gPC 潜在表型方法的有效性,发现一些 QTL 是新检测到的,同时也确认了部分之前报道过的 QTL。
- 候选基因:对每个单倍型块内的基因进行基因本体(Gene Ontology,GO)注释、保守结构域(Conserved Domains,CDs)分析以及与拟南芥(Arabidopsis thaliana)同源基因的比对,筛选出了潜在的候选基因。
在结论与讨论部分,研究表明,使用 gPCs 作为表型进行 GWAS 分析,能够有效简化数据集,捕捉基因型与环境的变异模式,揭示传统分析中遗漏的遗传位点,为研究大豆农艺性状的遗传机制提供了更全面的视角。尽管该方法存在数据信息损失和假设线性关系等局限性,但它在减少数据维度、增强结果解释性方面具有显著优势。同时,上位性分析虽然面临计算和统计上的挑战,但有助于发现基因间的相互作用,为深入理解复杂性状的遗传调控提供了重要线索。总体而言,该研究通过 GWAS 分析 gPCs 和 gPC QTL 的上位性分析,成功检测到控制大豆农艺性状的重要位点,为大豆育种提供了有价值的 QTL 资源,对推动大豆遗传改良和保障全球粮食安全具有重要意义。