综述:基于预测的育种:优化和重塑项目的现代工具
【字体:
大
中
小
】
时间:2025年10月12日
来源:Crop Science 1.9
编辑推荐:
这篇综述系统阐述了预测育种如何通过基因组选择(GS)、高通量表型分析(HTP)、多组学整合和环境组学(enviromics)等工具重塑植物遗传改良范式。文章强调预测模型在低遗传力育种早期阶段的优势,指出其有效性严格依赖于训练集的遗传和环境域,并提倡利用随机模拟优化育种方案。作者呼吁育种实践应优先考虑预测可靠性而非因果解释,为现代育种项目提供了核心策略。
预测育种通过优先考虑模型预测能力而非因果解释,重塑了植物遗传改良范式。这种方法依赖于基因组选择(GS)、高通量表型分析(HTP)、多组学整合和环境组学等工具,可显著提高遗传增益和育种效率。然而,预测模型的有效性严格受限于训练集所代表的遗传和环境域,当外推到不相关场景时存在明显风险。
传统育种方法如标记辅助选择(MAS)和全基因组关联分析(GWAS)在数量性状改良方面存在局限,这强化了对预测导向模型的需求。尽管解释性模型有助于理解生物学机制,但其泛化能力有限。相比之下,经过独立测试或交叉验证(CV)的预测模型,在支持育种项目决策方面展现出更大潜力。现代育种需要平衡解释深度与预测能力,特别是在面对动态农业环境场景时。
GS已成为育种项目的核心组成部分,通过全基因组单核苷酸多态性(SNP)数据早期预测个体遗传潜力。为确保预测准确性,训练集与测试集需保持遗传相关性。评估GS模型性能的方法包括k折交叉验证、留一法交叉验证(LOOCV)和多环境策略(如Jarquín等人提出的CV0-CV2)。预测能力指标(如Pearson's r)和相对效率对于模型比较至关重要。
环境组学通过整合环境协变量(ECs)来增强G×E互作建模。地理信息系统(GIS)分析是环境组学研究的基础步骤,包括确定目标环境群体(TPE)和提取环境协变量。反应规范模型可将基因型性能解释为对环境梯度的连续响应,显著提高不同环境条件下的预测准确性。
HTP技术通过RGB相机、高光谱成像仪、LiDAR等传感器,实现大规模、多时序的复杂性状采集。这些技术不仅可将传统评分性状转化为定量数据,还能作为"表型标记"间接捕获连锁不平衡(LD)。将HTP数据整合到多性状基因组选择(MTGS)模型中,可提高预测准确性,例如小麦研究中准确率从0.23提升至0.37。
多组学整合将基因组学、转录组学、蛋白质组学、代谢组学、表型组学和环境组学等数据层相结合,提供更全面的生物系统视角。研究表明,结合SNP、图像性状和代谢物数据的随机森林模型,可将玉米产量预测准确率从0.32提升至0.43。机器学习方法如随机森林、梯度提升机和堆叠集成学习(SEL)在多组学数据整合中表现出色。
随机模拟成为优化育种策略的重要工具,能够测试选择方案、优化训练群体、预测过拟合风险和降低成本。AlphaSimR等模拟软件可建模复杂遗传架构和长期育种策略。模拟应用涵盖平衡遗传多样性与遗传增益、比较育种方法、优化育种参数等多个方面。
预测育种模型必须在已验证的应用空间内使用,其可靠性严格依赖于训练数据的遗传和环境范围。对于复杂性状,应优先考虑预测可靠性而非因果解释。随机模拟通过虚拟建模育种周期和环境场景,为预测策略提供重要验证。育种实践的核心在于实现可靠的选择结果,这将推动育种创新并产生实际影响。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号