大豆早期耐涝性的基因组预测与关联分析:发掘新遗传资源与育种工具

【字体: 时间:2025年09月28日 来源:The Plant Genome 3.8

编辑推荐:

  本研究通过全基因组关联分析(GWAS)和随机森林(RF)模型,首次系统鉴定了大豆(Glycine max)V2/V4营养阶段早期耐涝性的关键基因组区域(Chr.4/17/20)和29个高效SNP标记,揭示了早期与中期耐涝性遗传架构的差异,为培育全生育期耐涝品种提供了精准基因组工具和育种策略。

  

Abstract

洪水胁迫已成为威胁全球大豆生产的主要因素。本研究聚焦于大豆V2/V4营养生长阶段的早期耐涝性,通过评估254份大豆种质资源,结合全基因组关联分析(GWAS)和机器学习驱动的基因组预测模型,揭示了与早期耐涝性相关的关键基因组区域和分子标记。研究发现,早期耐涝性的遗传机制与中期(生殖阶段)耐涝性截然不同,且通过随机森林(RF)模型筛选出的29个SNP可实现高达0.64的预测精度,显著优于传统方法。这些成果为大豆耐涝育种提供了新的遗传资源和精准工具。

1 INTRODUCTION

气候变化导致极端降水事件频发,洪水已成为美国第二大农业灾害,造成约4000亿美元损失。全球超过10%的耕地受洪水威胁,大豆作为易涝作物,在种子萌发、早期营养生长(V2–V4)和中期生殖生长(R1–R4)阶段均对涝害敏感。缺氧环境导致叶片褪绿、根系坏死、植株矮化和根瘤死亡,严重时可造成100%减产。尽管中期耐涝性的遗传资源和基因组区域已有较多研究,但早期耐涝性仍缺乏系统解析。本研究旨在填补这一空白,通过多模型GWAS和基因组预测,发掘早期耐涝性的关键基因位点,并评估预测模型在育种中的应用潜力。

2 MATERIALS AND METHODS

2.1 Experimental Design

2.1.1 Plant Materials and Genotypic Data
研究选用254份大豆种质,来源覆盖14个国家,成熟组(MG)涵盖IV、V、VI组。基因型数据基于SoySNP50K BeadChip获取,共31,410个SNP标记,均匀分布於20条染色体。
2.1.2 Field Trials and Data Collection
田间试验在阿肯色州斯图加特水稻研究中心进行,采用随机区组设计,三年重复。在V2/V4阶段进行8–10天淹水处理(水深5–10 cm),淹水结束后7天按1–9级标准评估涝害损伤评分(FDS)。通过计算Cronbach’s α(α=0.83)确保评分一致性,并使用混合线性模型计算基因型调整平均值。

2.2 Genomic Analysis

2.2.1 Genome-Wide Association Studies (GWAS)
采用BLINK(Bayesian-information and linkage-disequilibrium iteratively nested keyway)和MLMM(multiple locus mixed linear model)两种模型进行关联分析。显著性阈值通过Sidak校正确定(αp=7.89×10?5),有效独立检验数(Meff)≈650。
2.2.2 Genomic Prediction Models
基于随机森林(RF)算法构建前向逐步基因组预测模型。首先通过偏最小二乘(PLS)模型计算变量重要性(VIP),筛选VIP≥1.5且互相关性<0.7的SNP,最终纳入613个标记。模型通过五折交叉验证评估预测精度(r),并以RR-BLUP(ridge regression best linear unbiased prediction)作为基准对比。

3 RESULTS AND DISCUSSION

3.1 Flooding Response

两年平均FDS为4.4(标准差1.2–1.3),鉴定出14个高耐基因型(FDS≤3.0,如PI594567A)和18个高感基因型(FDS≥6.0,如PI424445)。耐涝性与来源国家、成熟组、花色等农艺性状无显著相关性。

3.2 Genomic Regions of Interest

GWAS分析在Chr.4、17和20上鉴定到显著关联位点:
  • Chr.4(ss715587369):附近基因包括B-box锌指蛋白(Glyma.04g027000,同源拟南芥STH2)和α/β水解酶(Glyma.04g026500/026900),可能通过转录调控和脂代谢参与应激响应。
  • Chr.17(ss715628153/154):关联基因涉及核苷碱基-抗坏血酸转运蛋白(NAT,Glyma.17g092300)、亚精胺合成酶(Glyma.17g092400)和钙调蛋白结合蛋白(Glyma.17g092700),功能覆盖抗氧化、多胺合成和钙信号通路。
  • Chr.20(ss715638723):Glyma.20g228000编码蛋白激酶样结构域,可能通过磷酸化调控应激信号传导。
这些区域与已报道的中期耐涝性QTL无重叠,证实早期耐涝具有独特遗传架构。

3.3 Feature Selection and Prediction Accuracy

RF模型通过逐步添加SNP优化预测精度,在纳入29个SNP时达到最高精度(r=0.64,RMSE=0.72)。相比之下,使用全部31,410个SNP的RF模型精度仅0.30,RR-BLUP模型为0.46。结果表明,过多SNP引入的多重共线性和过拟合会显著降低模型性能,而针对性筛选关键标记可大幅提升预测效率。

4 CONCLUSIONS

本研究首次系统解析了大豆早期耐涝性的遗传基础,发现其与中期耐涝性存在显著差异。通过GWAS鉴定到Chr.4/17/20上的关键区域及相关候选基因,并开发出基于29个SNP的RF预测模型(精度0.64)。这些成果为培育全生育期耐涝品种提供了分子工具和遗传资源,对保障洪水胁迫下的大豆安全生产具有重要意义。

作者贡献与致谢

Caio Canella Vieira负责概念设计、数据分析和论文撰写;Chengjun Wu参与试验设计与数据收集;Derrick Harrison等负责田间操作与验证;Grover Shannon和Henry T. Nguyen指导项目设计与资金支持。研究得到美国大豆委员会(USB)项目资助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号