《BMC Genomics》:Design and verification of a 25 K multiple-SNP liquid-capture chip by target sequencing for dairy goat
编辑推荐:
在奶山羊遗传育种研究中,传统基因分型方法存在局限,现有山羊芯片在功能位点等方面有缺陷,无法满足精准遗传分析需求。研究人员开展奶山羊 25 K 多 SNP 液相捕获芯片设计与验证研究,该芯片性能优良,为奶山羊遗传研究和育种提供有力支持。
在奶山羊遗传育种的领域里,就如同一场探索未知宝藏的冒险,基因分型技术的发展至关重要。当前,传统的基因分型方法像是破旧的寻宝地图,存在诸多局限,难以满足精准遗传分析的需求。而现有的商业山羊 SNP 芯片,也如同不合身的工具,在功能位点等方面存在不足,无法精准地助力奶山羊的遗传研究与育种工作。这就好比在黑暗中摸索,急切需要一盏明灯照亮前行的道路。于是,西北农林科技大学等研究机构的研究人员开启了一项极具意义的研究,旨在设计一款专门为奶山羊打造的高分辨率、多 SNP 液相捕获芯片,希望能为奶山羊产业的发展带来新的曙光。
这项研究成果发表在《BMC Genomics》上。研究人员为开展此项研究,采用了多种关键技术方法。首先是样本采集与测序,从中国陕西省的四个奶山羊品种采集样本,提取 DNA 后进行全基因组测序,并从公共数据库下载其他山羊品种的重测序数据。接着运用 Trimmomatic v0.39 和 BWAMEM v0.7.15-r1140 等软件对测序数据进行处理、比对和变异检测,还利用 GATK 软件包进行 SNP 的筛选和注释。同时,通过 FST、θπ、XP-CLR 分析以及全基因组关联分析(GWAS)等方法筛选出与奶山羊重要经济性状相关的位点。
研究结果如下:
- 数据处理与芯片设计策略:对 348 只奶山羊进行基因组重测序,并结合 11 个品种 126 个体的全基因组测序数据进行分析。获得了大量的测序数据,平均基因组测序深度为 15.2X,平均基因组覆盖率达 97.15%,且 99.63% 的测序读段成功比对到山羊参考基因组 ARS1.2。在此基础上,确定了芯片设计的候选 SNP 位点。
- 信号位点选择与品种鉴定 SNP 位点筛选:通过对奶山羊和非奶山羊品种进行 FST、θπ 和 XP-CLR 分析,发现了 4117 个与重要性状相关的候选 SNP 位点。同时,利用机器学习算法筛选出 7030 个用于品种鉴定的候选 SNP 位点,这些位点能有效区分不同奶山羊品种。
- 功能 SNP 位点筛选:综合 GWAS、文献研究和山羊 QTLdb 数据库信息,筛选出 6172 个与奶山羊重要经济性状相关的 SNP 位点。
- 芯片捕获 SNP 位点分析与验证:最终确定了 27396 个 SNP 位点用于探针设计,该芯片可检测 46459 个 SNP。芯片位点分布均匀,测序数据质量可靠,SNP 检测率高,杂合度合理。对 7 个奶山羊品种进行芯片验证,主成分分析(PCA)结果表明这些 SNP 位点能有效区分不同品种。此外,通过 GWAS 分析,还发现了与产仔数和出生体重性状相关的多个 SNP 位点和基因。
研究结论和讨论部分指出,该研究设计的 25 K 多 SNP 液相捕获芯片具有高分辨率、高灵敏度和高特异性,相比传统固态芯片成本更低,功能位点可动态更新,能更精准地捕获目标 SNP 位点。通过该芯片,研究人员初步确定了与产仔数和出生体重相关的 SNP 位点和基因,为后续深入研究奶山羊的遗传机制奠定了基础。尽管研究存在一定局限性,如可能未涵盖所有功能位点,对其他地区或品种的适用性有待验证,但随着研究的深入和技术的发展,可根据实际情况进一步优化芯片位点。这项研究为奶山羊的遗传研究和育种提供了强有力的工具,推动了奶山羊产业向高质量、高效率发展,在奶山羊遗传育种领域具有重要的意义。