表型预测与基因组预测准确性比较的误区解析:育种选择新视角

《The Plant Phenome Journal》:Do not benchmark phenomic prediction against genomic prediction accuracy

【字体: 时间:2025年07月31日 来源:The Plant Phenome Journal CS5

编辑推荐:

  这篇综述批判性地分析了当前植物育种中表型预测(PP)与基因组预测(GP)模型的比较方法。研究通过理论推导和三项案例研究的重新分析证明,常用的交叉验证预测能力(predictive ability)指标不能准确反映育种方程中的选择准确性参数(accuracy)。文章指出,PP模型预测能力常被高估,而GP模型则被低估,且两种策略对育种方程其他参数(选择强度、遗传方差和周期长度)的影响差异显著。作者建议采用双变量线性混合模型等更准确的方法评估PP准确性,并强调育种方案比较应综合考虑所有参数。

  

引言

植物育种通过种群创建、评估和选择的循环迭代培育新品种。传统育种基于表型测量,但田间试验耗时数年。基因组选择(GS)利用遗传标记数据通过基因组预测(GP)模型估算遗传值,可提高选择强度(i)、准确性(r)或缩短周期长度(L)。表型选择(PS)则采用高通量表型(HTP)技术和机器学习模型进行表型预测(PP)。近期研究常通过比较PP与GP模型的预测能力来证明PP的优越性,但这种方法存在根本缺陷。

材料与方法

研究重新分析了Rincent等(小麦和杨树)、Winn等(小麦产量)和Krause等(小麦产量)的三项代表性研究数据。采用八折或五折交叉验证计算预测能力,同时使用Runcie和Cheng提出的双变量线性混合模型直接估计遗传相关性来评估准确性。GP模型采用rrBLUP方法,PP模型则根据原始研究分别采用线性混合模型或固定效应模型。

结果与理论

重新分析显示,几乎所有性状的PP与GP准确性差异都小于原报告预测能力差异。在8个性状中,PP预测能力较高但实际准确性反而更低。路径分析揭示:GP模型中预测值(g?)与真实育种值(A)的相关系数(r(g?,A))等于其与表型(P)的相关系数除以遗传力平方根;而PP模型因共享非加性遗传和环境效应,预测能力(r(p?,P))可能高估实际准确性。

讨论

预测能力比较的局限性体现在三方面:1) 不能准确反映育种方程参数;2) 忽略了对其他参数的不同影响;3) 训练集规模假设不合理。GS可通过"两部分"方案将周期缩短至1年,而PS通常需要植株成熟才能采集数据。虽然PS可能评估更多候选株,但选择强度(i)随候选数量对数增长,需指数级增加规模才能弥补准确性差异。

结论

表型选择在育种中确有应用价值,特别是用于提高GP模型训练数据质量时。但比较PP与GP预测能力的常规方法存在误导性,应停止此类不当比较。未来研究应报告PP的预测能力和GP的准确性,并综合评估对育种方程所有参数的影响。

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号