编辑推荐:
为解决水产养殖物种基因分型成本高、高杂合度物种填充性能缺乏系统评估等问题,研究人员针对双壳贝类开展 lcWGS 和 2b-RAD 数据的基因型填充策略研究,发现 0.5× 测序深度填充效果佳,提升 GP 阈值可提高准确性,为 GS 研究提供指导。
在水产养殖领域,精准高效的遗传育种是提升产业竞争力的核心。随着基因组选择(GS)和全基因组关联研究(GWAS)等技术的兴起,通过高密度单核苷酸多态性(SNP)标记解析经济性状遗传基础、加速育种进程成为可能。然而,大规模基因分型的高昂成本却像一道 “拦路虎”,尤其是对于全基因组测序(WGS)而言,其费用让许多涉及大样本量的研究望而却步。与此同时,水产养殖物种如双壳贝类往往具有高杂合度的基因组特征,这使得单倍型推断变得复杂,进一步影响了基因型填充(通过参考群体推断未检测标记)策略的有效性。此外,低覆盖全基因组重测序(lcWGS)与简化基因组测序(RRS,如 2b-RAD)等低成本技术虽被广泛应用,但在统一框架下评估它们的填充性能及与 GS 结合的潜力仍不明确。
为突破这些瓶颈,中国的研究人员以虾夷扇贝(Mizuhopecten yessoensis)为研究对象,在《Aquaculture》发表论文,开展了低覆盖全基因组与 2b-RAD 测序的基因型填充策略优化研究。研究旨在系统解析影响填充准确性的关键因素,建立经济高效的基因分型方案,为双壳贝类的基因组育种提供技术支撑。
研究主要采用了以下关键技术方法:首先从 NCBI 获取 50 个虾夷扇贝个体的全基因组测序(WGS,平均测序深度~20×)数据作为参考群体,模拟了不同测序深度的 lcWGS 和 2b-RAD 数据;运用相位分析和基因型填充软件构建单倍型参考面板,并通过严格的变异检测和质量控制筛选出高质量 SNP 标记;结合基因组预测和 GWAS 分析,评估填充数据在遗传分析中的实际效能。
性能研究
通过对 lcWGS 数据的分析发现,当测序深度仅为 0.5× 时,即可获得与全基因组水平相当的饱和填充 SNP 数量,填充准确率高达 94.76%。这表明极低测序深度下的 lcWGS 结合填充策略仍能有效捕获基因组变异信息。进一步研究发现,提高基因型概率(GP)阈值(如设置为 0.95)可显著提升低频和稀有等位基因(MAF<0.05)的填充准确性,这对于挖掘低频率功能性变异具有重要意义。
2b-RAD 数据填充效果
针对 2b-RAD 数据,研究显示使用中等或高密度参考面板(GP 阈值 0.95)时,全基因组 SNP 标记的填充准确率约为 95%。这说明 2b-RAD 技术通过填充可转化为高密度基因分型数据,兼具成本与效率优势。
基因组预测与 GWAS 效能
基因组预测结果显示,lcWGS 和 2b-RAD 数据的预测准确性(0.52-0.57)与高覆盖测序数据相当,验证了填充数据在 GS 中的实用性。在 GWAS 分析中,结合填充的 2b-RAD 数据使标记密度显著增加,与壳高性状相关的显著 SNP 数量从 344 个跃升至 1021 个,并挖掘到新的候选基因,充分展现了填充策略对提升关联分析效能的关键作用。
结论与意义
本研究系统评估了双壳贝类中 lcWGS 和 2b-RAD 数据的基因型填充性能,明确了测序深度、参考群体规模、MAF 及 GP 阈值等关键影响因素。研究证实,即使在极低测序深度下,通过优化填充策略仍可获得高精度的基因组数据,显著降低基因分型成本。同时,填充与 RRS 技术的结合为 GWAS 提供了更密集的标记集,增强了检测性状相关变异的能力,为解析复杂经济性状的遗传基础开辟了新路径。这些发现为水产养殖物种,尤其是高杂合度双壳贝类的基因组选择和分子育种提供了切实可行的技术方案,有望加速抗病、生长快等优良品种的培育进程,推动水产养殖业向高效、精准方向发展。