
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于环境协变量预测澳大利亚小麦基因型与环境互作及超级环境划分
【字体: 大 中 小 】 时间:2025年09月06日 来源:Theoretical and Applied Genetics 4.2
编辑推荐:
本研究针对澳大利亚小麦育种中普遍存在的基因型与环境互作(GEI)难题,通过整合多环境试验(MET)数据和环境协变量(ECs),建立了因子分析混合模型(FA)与随机森林相结合的预测框架。研究人员分析了114个试验环境的3,355个基因型数据,发现潜在环境因子与降雨、温度等ECs显著相关,成功预测了369,161个扩展环境的产量主效应和iClass环境类型。该研究为应对气候变化下非静态GEI效应提供了新策略,同时揭示了CIMMYT种质在北部地区的特殊适应性。成果发表于《Theoretical and Applied Genetics》,为靶向育种和品种布局提供了重要决策工具。
澳大利亚作为全球重要的小麦出口国,其多样化的种植环境带来了巨大的基因型与环境互作(GEI)挑战。从南部的温带地区到北部的亚热带区域,小麦生长季面临干旱、高温和土壤病原体等多重胁迫。传统育种中,这种复杂的GEI效应导致品种表现难以预测,正如Basford和Cooper早先指出的"选择效率低下"问题。更棘手的是,气候变化正在加剧环境波动性,使得原本稳定的超级环境边界变得模糊。
为破解这一难题,Nick S. Fradgley领衔的国际团队开展了一项开创性研究。他们收集了2011-2023年间覆盖澳大利亚主要麦区的114个环境试验数据,涉及3,355个基因型(包括CIMMYT和ICARDA引进种质)的34,293个田间观测。研究团队创新性地将因子分析混合模型(FA)与机器学习结合,首次实现了从环境协变量(ECs)预测潜在环境效应的突破。
关键技术方法包括:1) 使用SILO气象数据库和土壤网格数据构建186个ECs;2) 开发EC4MET R包处理环境数据;3) 采用三阶因子分析模型(FA3GRM)解析GEI;4) 通过随机森林预测环境主效应和因子载荷;5) 建立iClass系统划分超级环境;6) 利用基因组关系矩阵(GRM)和系谱矩阵(COP)进行基因组预测。
多环境试验模型比较
通过对比不同因子阶数的模型,FA3GRM模型解释了86.94%的遗传方差,显著优于系谱模型。如表1所示,该模型将GEI分解为三个潜在因子:第一因子(50%方差)与产量潜力相关,第二因子(26.3%方差)驱动交叉GEI,第三因子(10.6%方差)关联干旱胁迫。
环境互作类群特征
研究定义了6个iClass环境类型,其中ppn(39个环境)和ppp(34个环境)最为常见。如图2所示,ppn类群内部遗传相关性均值达0.7,而类群间仅0.17。图3-e揭示了iClass的时空动态性,如Junee地区在13年间出现了除npp外的所有iClass类型。
环境协变量关联
随机森林分析识别出关键ECs:第一因子与土壤持水能力(r>0.4)相关,第二因子关联抽穗-开花期温度(r=0.38),第三因子受开花后降雨负调控(r<-0.43)。图4显示,开花至籽粒充实期降雨总量对第三因子预测最重要(重要性评分>85)。
超级环境预测
将模型扩展至369,161个虚拟环境后,图7-9揭示了清晰的时空格局:ppn类群在沿海高雨量区占优,而ppp类群在内陆干旱区更常见。值得注意的是,2019年干旱导致西部麦区ppp类群比例激增,印证了气候波动对GEI的影响。
种质适应性差异
如图10所示,澳大利亚对照品种在干旱型环境(ppp)表现优异,而CIMMYT材料更适合北部高温多雨环境(ppn)。半矮秆基因Rht-1型材料第三因子得分显著低于高秆材料(p<0.001),这与Eagles等先前发现一致。
基因组预测验证
前向交叉验证显示(图11),整合ECs预测可使测试年份的预测准确度从0.29(MM模型)提升至0.53(FA3模型),但对未测试基因型的改进有限。
这项研究首次系统描绘了澳大利亚小麦种植区的GEI格局,建立了环境预测的新范式。其创新点在于:1) 将静态土壤特性与非静态气象ECs结合;2) 开发可推广的EC4MET分析流程;3) 量化了CIMMYT种质在特定环境的优势。正如讨论部分强调,该方法不仅适用于气候变化适应育种,还可扩展至其他作物。研究结果已直接应用于CAIGE项目的种质引进决策,并为建立动态化的品种推荐系统提供了理论框架。
生物通微信公众号
知名企业招聘