编辑推荐:
为解决利用商业杂交群体进行基因组选择(GS)时,极端采样策略导致遗传方差高估、基因组估计育种值(GEBV)偏差大的问题,研究人员以杜洛克 ×(长白 × 大白)猪为对象,优化方差组分(VC)估计和基因组预测。结果显示混合采样策略更优,该研究为家畜基因组育种提供指导。
在现代畜牧业中,基因组选择(GS)是一项极具影响力的技术,它基于全基因组密集标记,能够显著提升预测的准确性,已然成为动植物育种领域的主流手段。其中,基因组最佳线性无偏预测(GBLUP)模型,借助基因组信息所推导的遗传关系,对传统的基于系谱的最佳线性无偏预测模型进行了优化,在减少孟德尔抽样误差、精准区分全同胞个体遗传价值方面表现卓越。
然而,在实际应用过程中,仍存在诸多挑战。一方面,GS 高度依赖群体方差组分(VC)的准确估计,而这一过程不仅耗时,其结果还会直接影响后续基因组估计育种值(GEBV)的准确性和偏差。另一方面,当前家畜育种广泛采用杂交技术,旨在培育性能更优的杂种后代。虽然利用杂交群体进行 GS 具有诸多优势,比如能获取更多表型信息、方便进行大规模表型测量等,但对大量杂交个体进行基因分型成本高昂,因此需要制定合理的选择性基因分型策略。此前有研究表明,使用具有极端表型的个体作为参考群体,虽能提高预测准确性,但会导致 VC 估计偏差显著增大,进而使 GEBV 出现较大偏差。
为了攻克这些难题,推动家畜基因组育种技术的发展,相关研究人员开展了深入的探索。研究以杜洛克 ×(长白 × 大白)猪的三元杂交系统为研究对象,旨在优化基于商业杂交群体数据的 VC 估计和基因组预测方法。该研究成果发表在《animal》杂志上,为家畜基因组育种提供了重要的理论支持和实践指导。
在研究方法上,研究人员主要运用了以下关键技术:
- 基因型和表型模拟:对纯种猪进行基因分型,通过设定随机交叉生成配子池,进而产生后代基因型。同时,随机选取定量性状位点,模拟不同遗传力(h2 = 0.5、0.3 和 0.1)的性状,通过调整环境方差来实现不同遗传力水平。
- 设计预测方案:选取特定数量的猪作为候选群体,针对商业群体设计六种不同的采样策略,包括完全极端采样、完全随机采样以及四种混合采样方案,以探究不同采样策略对 VC 估计和基因组预测的影响。
- 估计方差组分:运用线性混合模型和平均信息 REML(AIREML)算法估计 VC,通过构建相关矩阵并迭代更新直至收敛,确保估计结果的准确性。
- 求解估计育种值:利用 GBLUP 模型,结合参考群体和候选群体的信息,估计所有个体的 GEBV,并通过计算预测准确性、预测偏差和选择响应等指标,评估不同采样策略和 VC 估计方法的效果。
研究结果如下:
- 表型统计:完全极端采样的平均真实育种值(TBV)高于完全随机采样,且其标准差随性状遗传力和采样规模减小而显著增加;混合采样策略下,平均 TBV 和标准差随极端表型个体比例下降而降低,趋近于商业群体水平。
- 方差组分估计:完全极端采样显著高估遗传方差(Vg),完全随机采样则能准确估计Vg。混合采样方案中,仅使用随机个体估计Vg更准确,且对于不同遗传力性状,所需随机个体比例和参考群体规模不同。
- 基于全参考群体估计方差组分的预测准确性:在不同遗传力性状的预测中,混合参考群体表现出色,能提供准确的育种值预测。对于中高遗传力性状,混合参考群体在较小规模下即可达到较高预测准确性;对于低遗传力性状,则需要较大规模的参考群体。
- 基于参考群体中随机杂交个体估计方差组分的预测准确性:对于中高遗传力性状,不同方差估计策略对预测准确性影响不同;对于低遗传力性状,改变方差估计策略对部分混合群体的准确性有提升作用。
- 改变方差估计策略对基因组估计育种值偏差的影响:完全随机采样的预测偏差最优,混合参考群体的预测偏差介于完全随机采样和完全极端采样之间,且随随机个体比例增加更接近 1。改变方差估计策略可显著改善混合参考群体的预测偏差。
- 不同预测场景下选择响应的评估:混合参考群体在选择响应方面更具优势,相比高遗传力性状,预测中等遗传力性状时需要更高比例的极端杂交个体。
研究结论与讨论部分指出,混合采样策略能平衡预测准确性和 GEBV 偏差。商业杂交群体在基因组预测中具有重要作用,其表型测量方便、信息丰富,还能对多个亲本来源的候选群体进行并行预测。优化后的采样策略结合了极端采样的预测优势和随机采样的方差估计优势,通过调整 VC 估计策略,可有效避免极端表型个体对遗传参数的高估,显著改善 GEBV 的偏差,确保预测准确性和选择响应。此外,研究还明确了不同遗传力性状所需的参考群体规模。这些研究成果为基于商业杂交群体的基因组选择提供了高效的优化方案和详细的指导,对未来家畜基因组育种的发展具有重要的推动作用,有望助力畜牧业实现更高效、精准的育种目标。