云岭山羊与努比亚山羊全基因组测序:构建高质量遗传变异图谱以支持本土山羊种质资源保护与育种创新

《Scientific Data》:Whole-genome sequencing of 56 Yunling goats and 21 Nubian goats

【字体: 时间:2025年12月17日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对我国重要地方品种云岭山羊遗传背景不清、适应性性状分子机制不明的问题,研究人员通过对56头云岭山羊和21头努比亚山羊进行全基因组测序(WGS),利用DNBSEQ-T7平台获得平均22x测序深度的高质量数据,比对至山羊T2T参考基因组(GCA_040806595.1),鉴定出15,780,879个云岭山羊和17,014,849个努比亚山羊的小变异以及22,028和23,873个结构变异(SV)。该数据集为解析山羊适应性进化、挖掘重要经济性状相关基因提供了宝贵资源,对本土遗传资源保护和精准育种具有重要意义。

  
山羊作为人类最早驯化的家畜之一,约在一万年前起源于扎格罗斯山脉的甘吉达雷地区,这一驯化事件标志着人类从狩猎采集社会向农业社会的重大转变。经过数千年的适应进化与人工选择,山羊已成为全球范围内重要的肉、奶、皮毛来源,对经济社会发展产生深远影响。中国拥有复杂多样的地理环境,孕育了丰富的地方山羊品种资源,其中云南省以其独特的农业生态区系分布着11个地方山羊品种。云岭山羊作为云南省的优良地方品种,以其耐粗饲、抗病性强、群体规模大而著称,不仅是当地肉类安全的重要保障,更是育种创新的关键遗传资源。通过将云岭母羊与引入的非洲努比亚公羊进行杂交,我国成功培育出专门化肉用山羊品种"云上黑山羊",该杂交后代在生长速度、饲料利用率和环境适应性方面表现出显著优势。
尽管云岭山羊在育种中具有重要地位,但其基因组特征及适应性性状的遗传基础仍不清楚。全基因组测序技术的发展为系统解析山羊基因组复杂结构和群体分化提供了有力工具。与亲缘关系相近的绵羊相比,中国本土山羊品种适应性状的遗传机制研究相对滞后。为解决这一问题,研究人员对云岭山羊及其同域分布的努比亚山羊进行了全基因组测序,利用努比亚山羊基因组作为进化外群,区分云岭山羊中的祖先等位基因与谱系特异性适应位点。
这项发表在《Scientific Data》的研究,通过对77个山羊样本(56头云岭山羊和21头努比亚山羊)进行深度测序,构建了高质量基因组变异图谱。研究人员采用DNBSEQ-T7测序平台获得150bp双端 reads,平均测序深度达到22x,Q20质量值超过98%,与山羊T2T参考基因组的比对率超过99%,基因组覆盖度达98.55%。通过严格的质控流程,最终获得高质量的单核苷酸多态性(SNP)、插入缺失标记(Indel)和结构变异(SV)数据集。
主要技术方法包括:从云南双柏县(24°43'13" N,101°43'24" E)采集非近缘个体血样,使用TIANGEN基因组DNA试剂盒提取DNA,构建300-500bp插入片段文库;使用FastQC和fastp进行原始数据质控,BWA-MEM2比对至山羊T2T参考基因组,SAMtools处理BAM文件;采用GATK Best Practices流程调用SNP和Indel,Manta检测SV,经严格过滤(MAF>0.05,F_MISSING<0.1)后获得高质量变异集;使用ANNOVAR进行基因注释,PLINK进行主成分分析(PCA)。
数据质量验证结果
测序数据质量评估显示,所有样本的Q20分数均超过98%,GC含量分布稳定(平均43.74%)。比对后基因组平均覆盖度为98.55%,平均比对深度为20.48,表明数据质量可靠,适用于下游基因组分析。
结构变异质量
针对短读长测序在解析结构变异方面的固有局限,研究采用严格过滤标准(MAF>0.01,F_MISSING<0.1),将插入片段长度限制在50-500bp以匹配文库插入尺寸。过滤后,努比亚山羊和云岭山羊分别保留23,873和22,028个高置信度SV,基因组分布可视化显示各染色体SV密度差异。
小变异质量
对SNP和Indel应用GATK VariantFiltration模块进行硬过滤(QD≥2,FS≤60等参数),再经MAF>0.05和F_MISSING<0.1过滤,最终获得努比亚山羊15,492,559个SNP和1,522,290个Indel,云岭山羊14,442,532个SNP和1,338,347个Indel。小变异在全基因组范围内分布均匀,为群体遗传分析提供可靠基础。
群体遗传结构分析
基于共享SV和SNP的主成分分析均清晰区分云岭山羊和努比亚山羊群体,表明两个品种间存在显著的遗传分化。PCA结果一致性证明变异数据集能有效反映群体遗传结构。
变异注释结果
基因注释显示,大多数变异位于基因间区和内含子区域,外显子区变异比例较小。努比亚山羊和云岭山羊分别注释到105,089和97,723个外显子变异,以及348和221个外显子SV,这些功能区域变异可能与重要性状相关。
本研究通过对云岭山羊和努比亚山羊的高深度全基因组测序,构建了高质量基因组变异图谱,为解析山羊适应性进化和经济性状的遗传基础奠定了坚实基础。数据集涵盖SNP、Indel和SV等多种变异类型,经过严格质控和功能注释,具有高度的可靠性和可利用性。基于变异集的PCA分析证实了两个山羊品种间显著的遗传分化,为后续群体遗传学和选择信号分析提供了可靠依据。该资源将有力推动山羊基因组研究,为地方品种遗传资源保护、重要性状基因挖掘和精准育种策略制定提供重要数据支撑。所有原始数据、清洁数据和变异数据已分别存入NCBI SRA(SRP620567)、NGDC GSA(CRA026061)和EVA(PRJEB89951)数据库,供学术界共享使用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号