《Crop Science》:Modeling genotype-by-environment interaction for variety recommendation in tropical wheat
编辑推荐:
基因型-环境互作(genotype-by-environment interaction, GEI)的复杂性凸显了品种推荐中采用稳健方法的必要性。其不可预测性要求在未经测试的条件下进行预测,而气候变化加剧了这一挑战。育种项目必须在收获前预判哪些基因型-管理组合
基因型-环境互作(genotype-by-environment interaction, GEI)的复杂性凸显了品种推荐中采用稳健方法的必要性。其不可预测性要求在未经测试的条件下进行预测,而气候变化加剧了这一挑战。育种项目必须在收获前预判哪些基因型-管理组合将最为有效。本研究提出了一种改进的地理信息系统-因子分析(geographic information system–factor analytic, GIS-FA)预测方法,该方法整合了地理信息系统(GIS)技术、多管理因子分析(factor analytic, FA)模型、偏最小二乘(partial least squares, PLS)回归和环境协变量(environmental covariates, ECs),以预测未评估环境中的表型表现。数据集包含来自维索萨联邦大学(Federal University of Vi?osa, UFV)小麦育种项目的91个自交系和12个商业品种,在6年、7个地点(共25个环境)进行评估。环境差异图表明,南部地区与试验网络更为相似,而北部地区则表现出更高的差异值,反映了与实测试验条件更强的环境分歧。整合83个环境协变量(ECs)改善了产量预测。在雨养条件下,逐像素模型预测平均产量为4183 kg ha-1,比因子分析选择工具(factor analytic selection tools)选出的最佳基因型(UFV_19013)高出9.8%。在灌溉条件下,产量增益达到13.4%,预测平均产量为4756 kg ha-1,而UFV_19042的产量为4195 kg ha-1。这些结果凸显了空间显式方法在实现更精准、更针对特定地点的品种推荐方面的潜力。
**论文解读:基于改进地理信息系统-因子分析模型的热带小麦品种推荐研究**
**1. 研究背景与问题**
基因型-环境互作(genotype-by-environment interaction, GEI)是作物育种中的核心挑战,特别是在热带地区如巴西塞拉多(Cerrado),气候和土壤条件的高度变异性使得品种推荐尤为复杂。传统多环境试验(multi-environment trials, MET)虽能评估基因型在不同环境下的表现,但对未测试环境的预测能力有限,且气候变化进一步加剧了这一不确定性。此外,不同管理方式(如雨养与灌溉)对基因型表现的影响尚未被充分整合到预测模型中。现有方法如因子分析(factor analytic, FA)模型虽能通过潜变量分解GEI,但难以直接外推至未采样环境;而近期提出的地理信息系统-因子分析(geographic information system–factor analytic, GIS-FA)方法虽实现了空间外推,但其有效性高度依赖于试验环境对目标环境群体(target population of environments, TPE)的代表性。因此,亟需开发一种能整合多种管理条件、环境协变量(environmental covariates, ECs)及地理空间信息的预测框架,以支持热带小麦的精准品种推荐。
**2. 研究目的与意义**
本研究旨在:1)开发一种结合GIS-FA与多管理策略(雨养和灌溉)的预测方法,绘制米纳斯吉拉斯州(Minas Gerais)热带小麦的基因型适应区;2)识别具有广泛适应性的基因型及针对特定环境生态位的基因型,以优化育种决策。该研究发表在《Crop Science》上,其意义在于提供了一种可扩展的、空间显式的品种推荐工具,有望提升气候变化下作物品种布局的精准性和可持续性。
**3. 主要技术方法**
研究人员采用以下关键技术方法:1)线性混合模型(linear mixed model, LMM)结合因子分析(FA)协方差结构,对多环境试验数据进行表型分析,并依据平均半方差比(average semivariance ratio, ASR)选择最优因子数;2)偏最小二乘(partial least squares, PLS)回归,以试验环境的83个环境协变量(ECs)预测旋转后的环境载荷;3)随机森林空间插值(random forest spatial interpolation, RFSI),对来自NASA POWER、SoilGrids和MODIS等多源数据(空间分辨率1 km
2至50 km
2)进行空间降尺度,生成一致化的TPE环境矩阵;4)留一法交叉验证评估预测精度。样本来源为维索萨联邦大学(UFV)小麦育种项目的91个自交系和12个商业品种,在2018-2024年间于米纳斯吉拉斯州7个地点共25个环境中评价。
**4. 研究结果**
**4.1 表型变异性与因子模型选择**
不同环境间的遗传方差显著(P<0.05),广义遗传力(H
m2)范围为0.28至0.94,变异系数(CV
m%)范围为6.70%至32.35%。根据ASR标准,含4个因子的FA模型(FA4)解释了75.78%的遗传方差,被选为最优模型。
**4.2 基因型-环境互作与遗传相关**
环境对间的遗传相关从-0.9666(E16 vs. E19)到0.9494(E5 vs. E6)不等,约43%的成对比较呈负相关,表明存在显著的交叉互作。灌溉与雨养环境在遗传相关聚类中未完全分离,提示管理并非唯一驱动因素。
**4.3 基因型选择与适应性分析**
在雨养条件下,UFV_19013通过因子分析选择工具(FAST)获得最高指数(1.71),但其综合性能(整体性能OP和均方根偏差RMSD)不如UFV_9007等更稳定的基因型。灌溉条件下,UFV_19042以最高OP(444.22)当选。通过“胜者-何处”图(which-won-where),BRS_264在北部干旱区域占优,而UFV_19087在南部及Triangulo Mineiro地区表现突出,两者均展示出特定地理适应性。
**4.4 多管理系统预测**
基于逐像素预测,雨养条件下最佳基因型平均产量4183 kg ha
-1,较FAST推荐基因型提高9.8%;灌溉条件下提高13.4%(4756 vs. 4195 kg ha
-1)。环境差异图显示南部区域与试验环境高度相似,预测可靠性较高;北部区域差异值大,需扩展试验网络以提高精度。
**4.5 初步讨论与结论**
研究人员指出,本研究提出的多管理GIS-FA方法通过整合ECs和管理特异性截距,显著提升了未测试环境下的产量预测精度。但该方法的有效性高度依赖于试验环境对TPE的代表性,且当前数据中不同基因型间物候周期差异被忽视,可能引入偏差。未来需结合分子数据和更精细的环境信息,以增强模型鲁棒性。结论部分(翻译):基因型BRS_264、UFV_14055、UFV_19042和UFV_19087在两种管理条件下均被同时选中,成为巴西热带地区不同耕作体系中的推荐候选材料。自交系UFV_19087(雨养)和UFV_19042(灌溉)表现出优于商业对照的性能和广泛适应性。未来研究应聚焦于整合分子数据、优化区域性杂交组合,并评估将基因型分配至特定环境的风险,以应对气候变化下现代品种的适应需求。