
-
生物通官微
陪你抓住生命科技
跳动的脉搏
整合显著标记与基因型×环境互作模型提升花生产量预测精度
【字体: 大 中 小 】 时间:2025年08月26日 来源:The Plant Genome 3.8
编辑推荐:
这篇研究通过评估四种基因组预测(GP)模型在花生产量相关性状(PY、SW、SW100)中的表现,揭示了整合显著标记和基因型×环境互作(G×E)对预测能力的提升作用。结果表明,包含G×E的模型(M3、M4)能显著降低环境与残差方差,尤其在CV1和CV00场景下优势明显,为缺乏表型数据的育种场景提供了高效解决方案。
花生(Arachis hypogaea L.)是热带地区小农户的重要经济作物,但其在撒哈拉以南非洲(SSA)的产量长期低于全球平均水平。气候变迁加剧了产量波动,因此培育抗逆高产品种成为关键目标。多环境试验(MET)中,基因型×环境互作(G×E)会改变基因型排名,增加选择难度。本研究通过整合基因组预测(GP)与G×E模型,旨在优化花生育种策略。
试验设计:192个ICRISAT育成的花生品系在乌干达(Serere、Nakabango)和马拉维(Chitala、Chitedze)四个环境下进行MET,采用α格子设计。性状包括荚果产量(PY)、种子重量(SW)和百粒重(SW100)。基因型数据经质控后保留38,853个SNP。
模型构建:
M1:基础表型模型(环境+品系随机效应)
M2:加入基因组主效应(环境+品系+基因组随机效应)
M3:扩展为包含G×E互作(环境+品系+基因组+G×E随机效应)
M4:在M3基础上固定显著GWAS标记(111个PY相关、187个SW相关、96个SW100相关)
验证策略:采用四种交叉验证(CV)方案模拟实际育种场景:
CV2:已知基因型在已知环境预测未知组合(模拟稀疏测试)
CV1:预测未知基因型在已知环境
CV0:预测已知基因型在未知环境
CV00:预测未知基因型在未知环境(最具挑战性)
表型与遗传力:PY、SW和SW100的遗传力(H2)范围分别为0.39–0.85、0.42–0.77和0.10–0.76。G×E解释了SW100高达16%的方差,而残差方差占比最高达52%。
模型表现:
方差分解:M4显著降低环境与残差方差(PY降4.8%和2.9%;SW降5.4%和4.0%)。
预测能力:
CV2下M4预测能力最高(PY 0.78,SW 0.71,SW100 0.90),因训练数据充足。
CV1和CV00中,M4因整合显著标记表现突出(PY预测能力提升至0.73)。
CV0下M2(仅基因组主效应)最优,暗示G×E在预测新环境中作用有限。
G×E的价值:通过反应范数模型(Jarquín et al., 2014)建模G×E,有效捕捉了基因型对环境响应的异质性。这与大豆(Canella Vieira et al., 2022)和木薯(Lubanga et al., 2025)研究一致,但SW100因环境协变量解释力不足未显示优势。
标记整合策略:固定效应标记在低信息场景(CV1/CV00)提升显著,与水稻(Spindel et al., 2016)和辣椒(Kim et al., 2022)结论吻合。未来需探索非线性模型(如CGM-WGP)和非高斯先验优化。
局限与方向:单季节数据未涵盖基因型×年份(G×Y)效应,且高斯先验可能低估大效应标记。建议结合惩罚回归(Avagyan et al., 2025)和随机回归(Tolhurst et al., 2022)深化研究。
整合G×E与显著标记的GP模型可显著提升花生育种效率,尤其在资源有限时(如预测新基因型或环境)。CV2的优异表现支持通过多环境测试积累数据,而CV1/CV00的优化方案为早期选择提供了可行路径。
生物通微信公众号
知名企业招聘