
-
生物通官微
陪你抓住生命科技
跳动的脉搏
整合多群体数据与先验知识提升猪基因组预测准确性的创新研究
【字体: 大 中 小 】 时间:2025年08月28日 来源:BMC Genomics 3.7
编辑推荐:
本研究针对猪基因组选择(GS)中参考群体规模与结构限制预测准确性的关键问题,通过整合九大独立约克夏猪群体数据,系统评估了GBLUP、双变量GBLUP和GFBLUP模型在联合预测中的表现。研究发现表型均值差异和遗传方差显著影响脂肪厚度性状的联合评估效果,而整合meta-GWAS先验的GFBLUP模型在目标与参考群体遗传贡献相似时可提升11.65%的预测准确度,为优化猪育种策略提供了重要理论依据。
在现代化生猪育种中,基因组选择(Genomic Selection, GS)技术已成为改良经济性状的核心工具。然而这项技术的实际应用仍面临重大挑战——参考群体的规模与组成如同"双刃剑",过小的群体导致预测精度不足,而盲目扩大群体又可能因遗传异质性适得其反。更棘手的是,不同育种体系下的猪群往往存在表型分布差异、连锁不平衡(Linkage Disequilibrium, LD)结构不一致等复杂情况,使得联合评估的预测效果充满不确定性。
针对这一行业痛点,Junliang Wang团队在《BMC Genomics》发表的重要研究,创新性地提出整合多群体数据与meta-GWAS先验知识的解决方案。研究团队收集了九个遗传隔离的中国约克夏猪群体数据,聚焦100kg体重日龄(DAYS_100)和背膘厚度(BFT_100)两个关键经济性状,通过系统比较GBLUP、双变量GBLUP和基因组特征最佳线性无偏预测(Genomic Feature BLUP, GFBLUP)三大模型的联合评估表现,揭示了群体相似性与预测精度的内在关联。
研究采用三大关键技术方法:首先基于猪基因组参考面板(PGRP)对九个群体的基因型数据进行标准化处理和质控,获得345,354个SNPs;其次通过主成分分析(PCA)和LD一致性分析评估群体遗传结构;最后采用10×5折交叉验证比较不同模型的预测精度,并计算基因组特征标记集的遗传力富集值。
群体相似性分析揭示关键影响因素
通过三维PCA可视化发现P1、P5、P7和P8群体存在显著重叠区域,而LD热图显示P7群体与P1的LD一致性最高(r=0.978)。表型分析表明P4群体的DAYS_100性状与P1的表型变异系数(CV)差异仅0.78%,这些发现为后续模型比较提供了群体配对的生物学依据。
模型比较凸显GFBLUP优势
常规GBLUP模型在P1_P4组合中DAYS_100预测精度达0.171,而整合meta-GWAS先验的GFBLUP_CRGM模型将该值提升至0.191。最具突破性的是GFBLUP_UCRG模型,当选择P<1×10-4显著性阈值时,P1_P4组合的预测精度飙升至0.250,较单群体模型提高46.49%(P<0.001)。研究同时发现该模型对BFT_100性状改善有限,遗传力富集分析揭示其基因组特征标记集在P1群体的贡献度仅为15.91,显著低于其他群体。
遗传架构解析提供新见解
在P<1×10-4阈值下,DAYS_100特征标记在P1和P4群体的遗传力富集值分别为296.02和297.79,差异仅0.6%,这解释了为何P1_P4组合表现最优。而P1_P5组合的富集值骤降80.8%,印证了遗传贡献相似性是模型成功的关键。
这项研究开创性地证实:通过智能筛选参考群体并区分"保守效应"与"群体特异性"标记,GFBLUP模型可显著提升跨群体基因组预测的准确性。特别值得注意的是,研究揭示表型均值差异对BFT_100性状预测的影响(P<0.01)远大于LD结构等因素,这一发现为育种实践中参考群体的选择提供了明确标准。该成果不仅为猪基因组选择技术制定了更精确的实施框架,其提出的"先验知识引导的联合评估"策略,对其它畜禽的跨群体基因组预测也具有重要借鉴意义。
生物通微信公众号
知名企业招聘