编辑推荐:
为探究基因组选择影响因素,研究人员以中国荷斯坦奶牛为对象,发现群体内选择更优,合并群体可提效,意义重大。
在现代动物育种领域,基因组选择(Genomic Selection)就像一把精准的 “遗传钥匙”,能够帮助育种者快速且高效地筛选出具有优良遗传特质的个体,大大加速了动物品种改良的进程。然而,这把 “钥匙” 在实际使用中却面临诸多挑战。例如,参考群体(Reference Population)的规模、其与候选群体(Candidate Population)的遗传相关性,以及标记密度(Marker Density)等因素,都如同隐藏在 “锁芯” 中的复杂机关,影响着基因组选择这把 “钥匙” 能否精准开启遗传改良的大门。
在实际应用场景里,当育种者试图构建参考群体时,常常会陷入两难境地。一方面,构建一个足够大的参考群体对确保基因组选择的准确性至关重要。但在一些情况下,由于育种群体规模有限,或者收集感兴趣性状的表型数据困难重重,再加上基因分型成本高昂,使得构建大参考群体成为一项艰巨任务。另一方面,不同地区、不同来源的同一品种动物,即便属于同一品种,其遗传背景也可能存在差异,如等位基因频率和连锁不平衡的不同,这让人们对跨群体基因组选择的预测能力充满疑惑。此外,随着基因检测技术的发展,从单核苷酸多态性(Single Nucleotide Polymorphism,SNP)芯片到序列水平基因型数据的转变,也引发了新的思考:使用序列水平数据是否真的能提升基因组预测的准确性?尤其是在跨群体预测方面,其效果究竟如何?
为了攻克这些难题,山东农业大学动物科技学院的研究人员挺身而出,开展了一项极具价值的研究。该研究成果发表在《Animal - Open Space》上,为基因组选择领域带来了新的曙光。
在研究过程中,研究人员主要运用了以下关键技术方法:首先,精心选取了三个不同的参考群体,包括来自山东省五个牛群的 1688 头荷斯坦奶牛组成的山东(SD)群体、来自中国其他地区(主要是北京和上海)30 个牛群的 5299 头荷斯坦奶牛组成的非山东(Non - SD)群体,以及这两个群体合并而成的组合群体。其次,利用农场自动挤奶系统(Afimilk Rotary Milking Parlor)记录奶牛的日产奶量,借助牛奶成分分析仪(Foss Milkoscan TM FT + milk analyzer)获取牛奶成分(脂肪、蛋白质和体细胞计数)数据,并通过 100k SNP 芯片(GeneSeek Genomic Profiler Bovine 100K)或 150k SNP 芯片(GeneSeek Genomic Profiler Bovine HDv3)获取 SNP 数据。之后,运用主成分分析(Principal Component Analysis,PCA)技术检测 SD 和 Non - SD 群体的遗传背景差异,并采用特定方法计算群体间和群体内的基因组距离(以 FST,即固定指数衡量)。最后,使用随机回归测试日模型(Random Regression Test - Day Model)对测试日记录进行拟合,评估基因组预测性能。
研究结果主要体现在以下几个方面:
- 基因组距离:通过 PCA 分析发现,SD 个体能够较好地聚集在一起,大部分 Non - SD 个体与 SD 个体较为接近,但仍有部分 Non - SD 个体存在一定距离。进一步研究得出,SD 群体内的基因组距离(FST=0.0017±0.0001)小于 Non - SD 群体内的基因组距离(FST=0.0064±0.0067),而 SD 和 Non - SD 群体之间的基因组距离(FST=0.0150)则明显大于群体内距离。这表明两个群体虽然同属荷斯坦奶牛品种,但在遗传背景上确实存在一定差异。
- 基因组预测性能:研究数据显示,使用 SD 参考群体进行基因组预测的性能在所有性状上均优于使用 Non - SD 参考群体,即便 SD 群体规模远小于 Non - SD 群体。将两个群体合并后,预测性能得到显著增强。在标记密度方面,相较于使用 150k 基因型,使用推算的序列基因型对所有性状和参考群体的预测准确性仅有轻微提升,且这种提升在跨群体预测中并不明显。此外,在所有预测场景中,基因组估计育种值(Genomic Estimated Breeding Value,GEBV)均存在一定偏差,尤其是使用 Non - SD 参考群体时偏差较大。不过,使用组合参考群体相较于单独使用 SD 或 Non - SD 参考群体,偏差更小,使用推算序列数据的无偏性也略有改善 。
综合研究结果与讨论,该研究明确了在基因组选择中,参考群体与候选群体的遗传相关性至关重要。使用遗传背景差异较大的参考群体,即便其规模庞大,也可能导致预测准确性不佳。而将同一品种其他群体的数据添加到参考群体中,能够有效提高基因组预测的准确性。这一发现为动物育种工作提供了重要的理论依据和实践指导,有助于育种者更科学地规划和实施基因组选择方案,优化育种策略,进而加速动物品种的遗传改良进程,提高畜牧业的生产效率和经济效益,在现代动物育种领域具有深远的意义。