表型预测与基因组预测准确性比较的误区解析：育种选择新视角

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《The Plant Phenome Journal》：Do not benchmark phenomic prediction against genomic prediction accuracy

【字体：大中小】 时间：2025年07月31日 来源：The Plant Phenome Journal CS5

编辑推荐：

　　这篇综述批判性地分析了当前植物育种中表型预测(PP)与基因组预测(GP)模型的比较方法。研究通过理论推导和三项案例研究的重新分析证明，常用的交叉验证预测能力(predictive ability)指标不能准确反映育种方程中的选择准确性参数(accuracy)。文章指出，PP模型预测能力常被高估，而GP模型则被低估，且两种策略对育种方程其他参数(选择强度、遗传方差和周期长度)的影响差异显著。作者建议采用双变量线性混合模型等更准确的方法评估PP准确性，并强调育种方案比较应综合考虑所有参数。

引言

植物育种通过种群创建、评估和选择的循环迭代培育新品种。传统育种基于表型测量，但田间试验耗时数年。基因组选择(GS)利用遗传标记数据通过基因组预测(GP)模型估算遗传值，可提高选择强度(i)、准确性(r)或缩短周期长度(L)。表型选择(PS)则采用高通量表型(HTP)技术和机器学习模型进行表型预测(PP)。近期研究常通过比较PP与GP模型的预测能力来证明PP的优越性，但这种方法存在根本缺陷。

材料与方法

研究重新分析了Rincent等(小麦和杨树)、Winn等(小麦产量)和Krause等(小麦产量)的三项代表性研究数据。采用八折或五折交叉验证计算预测能力，同时使用Runcie和Cheng提出的双变量线性混合模型直接估计遗传相关性来评估准确性。GP模型采用rrBLUP方法，PP模型则根据原始研究分别采用线性混合模型或固定效应模型。

结果与理论

重新分析显示，几乎所有性状的PP与GP准确性差异都小于原报告预测能力差异。在8个性状中，PP预测能力较高但实际准确性反而更低。路径分析揭示：GP模型中预测值(^g?)与真实育种值(^A)的相关系数(r(^g?,^A))等于其与表型(^P)的相关系数除以遗传力平方根；而PP模型因共享非加性遗传和环境效应，预测能力(r(^p?,^P))可能高估实际准确性。

讨论

预测能力比较的局限性体现在三方面：1) 不能准确反映育种方程参数；2) 忽略了对其他参数的不同影响；3) 训练集规模假设不合理。GS可通过"两部分"方案将周期缩短至1年，而PS通常需要植株成熟才能采集数据。虽然PS可能评估更多候选株，但选择强度(i)随候选数量对数增长，需指数级增加规模才能弥补准确性差异。

结论

表型选择在育种中确有应用价值，特别是用于提高GP模型训练数据质量时。但比较PP与GP预测能力的常规方法存在误导性，应停止此类不当比较。未来研究应报告PP的预测能力和GP的准确性，并综合评估对育种方程所有参数的影响。

联系信箱：

粤ICP备09063491号

引言

材料与方法

结果与理论

讨论

结论

热点排行