基于扩增子测序的Guzerat牛下丘脑-垂体-性腺轴基因SNP筛选框架及其生殖意义研究

《BMC Genomic Data》:A framework for identifying and prioritizing SNPs in genes of the hypothalamic- pituitary-gonadal axis in Guzerat cattle using amplicon-based NGS

【字体: 时间:2025年10月29日 来源:BMC Genomic Data 2.5

编辑推荐:

  本研究针对巴西Guzerat牛青春期延迟导致的生殖效率低下问题,开发了结合靶向NGS技术与生物信息学分析的SNP筛选框架。通过对68个HPG轴基因的730个区域(覆盖136,274 bp)进行扩增子测序,从75头牛中鉴定出2,600个SNP,经多轮筛选(MAF≥5%、非同义替换、系统发育保守性等)获得30个候选位点。通过SIFT/PANTHER/PolyPhen2/MutPred等工具预测蛋白功能影响,结合AlphaFold2和DDMut进行结构稳定性分析,最终锁定IGF1R、LHCGR、TAC3R基因的3个SNP具有潜在功能影响,为后续实验验证提供重要靶点。该研究为家畜生殖性状的因果突变筛选提供了可推广的技术路径。

  
在巴西广袤的牧场中,一种名为Guzerat的瘤牛品种因其卓越的耐热性和抗病性成为当地畜牧业的重要支柱。然而,这些优秀的牛群却面临着一个棘手的难题——青春期延迟。这一生殖缺陷直接导致繁殖效率降低,给畜牧业带来显著经济损失。虽然营养和管理因素对此有影响,但遗传背景的作用不容忽视。传统育种技术难以快速定位关键基因突变,而全基因组测序成本高昂且数据分析复杂。正是在这一背景下,研究人员将目光投向了靶向测序技术,希望通过精准定位与生殖相关的基因区域,高效筛选出具有功能影响的遗传变异。
本研究采用了一种创新的技术路线,主要关键技术包括:1)基于68个HPG轴相关基因设计定制扩增子面板(730个区域/136,274 bp);2)对75头巴西Guzerat牛样本进行Illumina MiSeq双端测序;3)使用GATK流程进行变异检测,获得2,600个SNP和1,615个indel;4)通过MAF≥5%过滤、非同义替换筛选、系统发育保守性分析和生化特性评估等多步筛选;5)利用SIFT、PANTHER、PolyPhen2、MutPred等工具预测蛋白功能影响;6)采用AlphaFold2进行蛋白结构建模和DDMut评估稳定性变化。
性能评估与变异检测
研究人员首先评估了靶向测序实验的性能表现。测序共获得4,800万条读长,平均每个样本60万条读长,质量评分Phred值在前150个碱基位置均高于25。个体覆盖度介于3,326-57,869 bp之间,平均测序深度为6-222X,表明数据质量可靠。通过GATK流程分析,共检测到2,600个SNP和1,615个indel,变异密度分别为1个SNP/52 bp和1个indel/84 bp。功能注释显示,0.23%的变异具有高影响效应,23.04%为中等影响,其中59.52%位于外显子区域。
群体分析与初步筛选
研究人员随后进行了群体遗传学分析。去除低频率变异(MAF<5%)和多等位基因位点后,保留了475个SNP。进一步聚焦于可能影响蛋白功能的非同义替换,从中共筛选出102个分布于40个基因中的SNP。通过跨物种保守性分析(包括牛、水牛、骆驼、人类等15个物种),发现66个氨基酸位点在进化上高度保守,而在Guzerat牛中出现突变,提示这些位点可能具有重要功能。其中30个位点还发生了极性改变,可能对蛋白结构产生更大影响。
功能影响预测
为了评估这30个非同义替换的功能影响,研究团队使用了四种不同的生物信息学工具。SIFT预测18个突变有害,PANTHER-PSEP鉴定8个可能有害,PolyPhen-2判断15个可能有害,而MutPred2仅发现2个致病性突变。综合四种工具的结果,只有一个突变(TAC3R基因Cys372Gly)被所有工具认定为显著,另有四个突变(CGA Thr74Met、HELB Ser570Phe、IGF1R Arg1095Gly、LHCGR Thr469Pro)在三种工具中显示有害效应。
蛋白结构建模与稳定性分析
对上述五个重要候选基因编码的蛋白进行三维结构分析。由于PDB数据库中缺乏完整结构信息,研究人员采用AlphaFold2进行建模,所选模型的pLDDT置信度得分在65.1-86.4之间。通过DDMut分析突变对蛋白稳定性的影响,发现IGF1R、LHCGR和TAC3R的突变均导致蛋白稳定性降低(△△G<0 kcal/mol),而CGA和HELB突变则呈现稳定化效应。特别值得注意的是,TAC3R突变导致氢键数量从5个减少至2个,且LHCGR突变使氨基酸相互作用从碱性带正电荷的精氨酸变为酸性带负电荷的谷氨酸,这种电荷和极性的改变可能显著影响蛋白功能。
研究结论与意义
本研究成功建立了一个从靶向测序到候选突变筛选的完整技术框架。通过将扩增子NGS技术与多步骤生物信息学分析相结合,研究人员从初始的4,000多个多态性位点中逐步筛选出3个最具功能潜力的候选SNP(位于IGF1R、LHCGR和TAC3R基因)。这些突变不仅通过多种预测工具显示可能影响蛋白功能,而且结构建模表明它们会改变蛋白稳定性和分子相互作用。
这一研究方法的创新性在于提供了一条高效、经济的因果突变筛选路径,特别适用于具有重要经济性状的家畜育种研究。与传统依赖连锁不平衡的GWAS研究不同,该方法直接聚焦于功能区域,能够更精准地识别可能影响表型的遗传变异。研究中鉴定的三个关键基因为理解Guzerat牛青春期延迟的分子机制提供了新线索,也为后续通过分子动力学模拟或体外实验验证这些突变的功能影响奠定了基础。
该技术框架的可移植性使其不仅适用于牛生殖性状研究,还可广泛应用于其他经济性状(如生长速度、肌肉脂肪含量)和遗传疾病的因果突变鉴定。随着基因组学技术的不断发展,这种靶向与生物信息学相结合的策略有望成为精准动物育种的重要工具,加速遗传改良进程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号