编辑推荐:
在猪育种中,部分候选个体缺乏表型数据致育种值预测困难。本研究针对此,探究代谢组数据对猪日增重(ADG)育种值预测的影响,利用 MGBLUP 模型整合多组数据,发现代谢组数据可小幅提升 EBVs 准确性,为猪遗传评估提供新思路。
在猪的遗传育种领域,准确预测育种值对于提升猪的生产性能至关重要。然而,许多候选个体往往缺乏直接的表型数据,如产仔数、饲料效率等,这使得仅依靠传统的 pedigree(系谱)和 genomic markers(基因组标记)进行育种值预测面临挑战。代谢组学作为一种能够动态反映生物体生理状态的高维数据资源,其在血液中的代谢物谱可提供丰富的生理信息,为解决无表型个体的遗传评估问题带来了希望。此前有研究表明,代谢组数据在植物育种中能有效提升预测准确性,但在猪等动物中的应用效果尚不明确。基于此,丹麦养猪研究中心(Danish Pig Research Centre)等机构的研究人员开展了相关研究,旨在探索将代谢组数据整合到基因组预测模型中是否能提高猪日增重(Average Daily Gain, ADG)估计育种值(Estimated Breeding Values, EBVs)的准确性,该研究成果发表在《Genetics Selection Evolution》。
研究人员主要采用了以下关键技术方法:
- 数据采集:收集了 8174 头杜洛克猪的 ADG 表型数据、基因组信息(使用 50K GGP-Porcine Illumina Bead SNP 芯片进行基因分型,经质控后保留 33,960 个 SNPs)以及血液样本的核磁共振(Nuclear Magnetic Resonance, NMR)代谢组数据(检测到 28,119 个代谢组特征)。
- 模型构建:运用代谢组 - 基因组最佳线性无偏预测(Metabolomic-genomic Best Linear Unbiased Prediction, MGBLUP)模型,分两步计算 EBVs,并与仅基于基因组数据的 GBLUP 模型进行对比。
- 验证方案:采用 “测试站 - 育种 herd(群体)” 验证和五折交叉验证(5F)两种方案评估模型准确性,结合预测能力和线性回归(LR)方法计算 EBVs 的准确性。
研究结果
1. 方差组分估计
- GBLUP 模型中 ADG 的遗传力估计值为 0.14。
- MGBLUP 模型中,直接遗传力(direct heritability)为 0.15,代谢组特征解释的方差比例为 0.18,代谢组强度的遗传力为 0.14,总遗传力为 0.17,表明代谢组仅介导了部分遗传变异。
2. EBVs 准确性评估
- “测试站 - 育种 herd” 验证:
- 仅用基因组数据时,GBLUP 和 MGBLUP 的 EBVs 准确性分别为 0.60 和 0.61;同时加入代谢组数据后,MGBLUP 准确性提升至 0.62;若再加入表型数据,GBLUP 和 MGBLUP 的准确性分别达 0.72 和 0.74。
- 五折交叉验证:
- 仅用基因组数据时,两者准确性均为 0.87;加入代谢组数据后,MGBLUP 准确性仍为 0.87;加入表型数据后,GBLUP 和 MGBLUP 准确性分别为 0.91 和 0.92。
- 结果显示,加入代谢组数据可使 EBVs 准确性小幅提升,约为加入表型数据所提升准确性的 6%-10%。
结论与讨论
本研究证实,将代谢组数据整合到 MGBLUP 模型中可小幅提高猪 ADG 的 EBVs 准确性,尽管代谢组主要捕获的是环境变异,其介导的遗传方差比例较小。这一发现为猪遗传评估中利用高维生物数据提供了实证支持,尤其为无表型个体的育种值预测提供了新途径。然而,研究也指出,血液样本采集时间点(仅在生长末期)可能与 ADG 的累积性特征存在时间不匹配,导致代谢组数据的作用有限。未来研究可探索不同采样时间、其他组织代谢组以及更多性状,以进一步挖掘代谢组学在动物育种中的潜力。该研究不仅拓展了代谢组学在动物遗传领域的应用,也为优化猪育种方案提供了科学依据,有助于推动精准育种和高效养猪产业的发展。