支持非洲农业扩张的高分辨率大豆试验数据集:基因型×环境×管理互作与品种适应性分析

《Scientific Data》:High-resolution soybean trial data supporting the expansion of agriculture in Africa

【字体: 时间:2025年12月05日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对非洲大豆品种推荐缺乏系统环境适应性数据的瓶颈问题,由Soybean Innovation Lab(SIL)联合多国机构开展了为期十年(2015-2024/25)的泛非大豆品种试验(PATs),构建了包含21个国家138个地点292个试验点、366个品种的多环境试验(MET)数据集。研究通过因子分析(FA)模型和环境分型(envirotyping)方法,揭示了关键环境因子(如露点温度T2MDEW、土壤温度动态)对产量的调控作用,鉴定出高产稳产品种(如G072)。该资源为非洲大豆育种中的G×E×M(基因型×环境×管理)互作研究和品种精准推荐提供了数据基础。

  
在全球人口持续增长和蛋白质需求激增的背景下,大豆(Glycine max (L.) Merr.)作为重要的植物蛋白和油脂作物,其生产系统优化尤为关键。非洲大陆拥有巨大的农业扩张潜力,但大豆栽培面临核心挑战:品种在不同农业生态条件下的适应性不明确,缺乏系统的环境响应数据支撑品种推荐。传统育种往往忽视基因型(G)、环境(E)与管理(M)之间的复杂互作(G×E×M),导致品种在真实种植场景中表现不稳定。为此,由美国国际开发署(USAID)主导的Soybean Innovation Lab(SIL)联合非洲农业技术基金会(AATF)等机构,启动了泛非大豆品种试验(Pan-African Soybean Variety Trials, PATs),旨在通过大规模多环境试验(Multi-Environment Trial, MET)构建表型-环境关联数据库,驱动大豆在非洲的科学扩张。
为系统解析大豆品种在非洲多样化环境下的适应性规律,Mauricio S. Araujo等研究人员在《Scientific Data》发表了题为“High-resolution soybean trial data supporting the expansion of agriculture in Africa”的数据描述论文。研究团队整合了2015至2024/25十年间在21个非洲国家实施的292个试验点数据,覆盖366个大豆品种、26,280个试验小区,收录了形态、农艺、品质性状及土壤、气象、管理措施等95项环境协变量。通过因子分析混合模型(Factor Analytic Mixed Model)、最佳线性无偏预测(BLUP)和环境分型(envirotyping)等方法,揭示了关键环境驱动因子,鉴定了高产稳产品种,为非洲大豆育种中的G×E×M互作研究和品种精准推荐提供了宝贵资源。
研究采用的关键技术方法包括:基于限制性最大似然法(REML)的多环境试验统计模型,用于估计方差组分和基因型效应;因子分析(FA)模型解析G×E互作结构,并计算品种整体表现(OP)和均方根偏差(RMSD)作为稳定性指标;稀疏偏最小二乘回归(sPLS)筛选与产量关联最强的环境变量;环境数据来源于NASA POWER、WorldClim和SoilGrids等全球数据库,结合地理信息系统(GIS)进行空间表征。
Technical Validation I- Overview of the complete dataset
通过对7个关键农艺及品质性状的分析表明,试验网络覆盖了马拉维、赞比亚、肯尼亚和津巴布韦等主要大豆生产国(占总试验点的62.33%)。产量(GY)、百粒重(W100G)等性状表现出较宽分布,显示较大的遗传变异潜力;而蛋白质(PROT)和油脂(OIL)含量变异范围较窄,倒伏(LOD)评分则揭示部分品种的抗逆性差异。该数据集为兼顾高产与优质的平衡选择提供了表型基础。
Technical Validation II- Genotype-by-environment interaction in Malawi
以马拉维的34个环境为案例,研究发现广义遗传力(H2)在30%-50%之间,变异系数(CV)多数低于30%,表明试验质量可靠。遗传相关性热图显示,部分环境间存在高强度正相关(如Bwanje-2020与Chilanga-2020,r=0.97),而不同年份或地区间则出现显著负相关(如Bwanje-2020与Domasi-2021,r=-0.95),凸显了G×E互作中的“交叉现象”(crossover interaction)。通过因子分析选择工具(Factor Analytic Selection Tools, FAST)评估,基因型G072在整体表现(OP)和稳定性(RMSD)上综合最优,而G063虽产量中等但稳定性极高,适合稳产需求地区。
Technical Validation III- Environics Applied in Soybean Breeding
环境分型分析表明,海拔与平均温度呈负相关,但产量响应受水分管理调控:全灌溉条件下产量高且稳定,雨养环境则变异显著。通过稀疏偏最小二乘回归(sPLS)筛选出十大关键环境变量,其中露点温度(T2MDEW)、土壤昼夜温度范围(BIO2_Mean_Diurnal Range_5_15cm)和地表短波辐射(ALLSKY_SFC_SW_DWN)等气候因子对产量预测贡献最大,土壤pH和水分指标亦具重要影响。
本研究通过构建高分辨率大豆表型-环境互作数据库,建立了从基因型评价到环境驱动的品种推荐框架。因子分析模型(FA)和环境分型(envirotyping)方法的结合,实现了G×E×M互作的量化解析,为定义育种亚区(mega-environment)和精准品种布局提供了理论依据。该数据集不仅可直接用于机器学习预测模型开发,还能支撑非洲大豆育种项目的亲本选配和试验网络优化,推动作物适应性的跨尺度预测。作为迄今非洲最大规模的大豆试验数据资源,其开放获取将加速作物建模、遗传评估和农业决策的跨学科创新,实质性地促进非洲农业系统的可持续集约化。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号