低覆盖度全基因组测序技术实现复杂小鼠杂交群体高精度单倍型重建

【字体: 时间:2025年07月03日 来源:Mammalian Genome 2.7

编辑推荐:

  本研究针对复杂性状遗传研究中传统SNP芯片存在成本高、覆盖偏差大等局限,创新性地采用低覆盖度全基因组测序(lcWGS)技术,系统比较了其与ddRADseq和GigaMUGA芯片在多样性远交(DO)小鼠群体中的单倍型重建效果。研究发现lcWGS在低至0.1X覆盖度时仍能准确识别更多微小单倍型区块(<1 Mb),并成功召回90%以上的局部表达数量性状位点(eQTL),为复杂遗传研究提供了更经济精准的基因分型方案。

  

在遗传学研究领域,解析复杂性状的遗传基础犹如破解生命密码,而高质量的基因型数据就是解码的关键工具。传统采用SNP芯片(如GigaMUGA)对远交群体(如多样性远交DO小鼠)进行基因分型,虽已成为行业标准,却面临三大困境:高昂的实验成本限制了大规模研究;芯片探针的固有偏倚导致基因组覆盖不均;随着杂交世代增加,固定数量的标记位点难以捕捉日益精细的重组单倍型结构。这些问题严重制约了遗传定位的分辨率和准确性,特别是在需要数百样本才能检测微小效应QTL的研究中。

为突破这些技术瓶颈,The Jackson Laboratory的研究团队在《Mammalian Genome》发表了一项创新研究。他们系统评估了两种基因分型测序(GBS)策略——低覆盖度全基因组测序(lcWGS)和双酶切限制性位点关联DNA测序(ddRADseq),并与金标准GigaMUGA芯片进行头对头比较。通过48只DO小鼠的平行实验,结合183个DO来源胚胎样体的表达数量性状位点(eQTL)分析,证明lcWGS能以更低成本实现更精准的单倍型重建。

研究采用三项关键技术:1)使用plexWell LP384试剂盒制备lcWGS文库,实现0.1-1.14X覆盖度的全基因组测序;2)基于QUILT算法将reads比对至GRCm39参考基因组并进行SNP填充;3)利用R/qtl2软件包通过隐马尔可夫模型重建八种创始人单倍型的等位基因概率。为验证准确性,团队还对10个样本进行高覆盖度全基因组测序(hcWGS),并开发了从原始数据到单倍型重建的自动化分析流程。

【测序性能比较】实验数据显示,lcWGS平均覆盖1.14X时能检测54.96%的基因组区域,显著优于ddRADseq的13.42%。特别值得注意的是,lcWGS在重复序列区域的覆盖度比芯片标记高14%,更完整地捕获了传统方法难以覆盖的基因组区域。通过建立1M SNP标记网格,研究人员从3500万潜在SNP中筛选出82万高质量位点用于单倍型重建。

【单倍型重建准确性】在关键验证环节,lcWGS与芯片数据的平均余弦相似度达0.967,即使降至0.1X覆盖度仍保持0.957的高一致性。相比之下,ddRADseq在0.1X时相似度为0.965,但需要更高的测序深度。lcWGS还展现出更强的精细结构解析能力——识别出平均10.08 kb的最小单倍型区块,远优于芯片的57.88 kb,成功检测到芯片遗漏的157个额外交叉事件。

【eQTL定位应用】在183个DO胚胎样体的实证研究中,lcWGS在0.1X覆盖度时即可召回99%的芯片检测到的局部eQTL,且峰值定位更精确(支持区间平均缩小0.17 Mb)。等位基因效应估计的余弦相似度达0.9以上,证明其能无偏倚地反映遗传效应。

这项研究的重要意义在于:首先,lcWGS以芯片50%的成本实现了更高分辨率的基因分型,使大规模遗传研究更经济可行;其次,该方法突破了芯片的标记密度限制,能持续适应不断积累重组事件的远交群体;再者,标准化的生物信息流程(已开源)大大降低了技术门槛。正如作者强调的,这项技术不仅适用于DO小鼠,经过简单调整还可推广至协作交叉(CC)群体、基因修饰品系杂交(DOF1)等复杂遗传体系,为系统遗传学研究提供了强有力的工具支持。随着测序成本持续下降,lcWGS有望成为复杂动物模型基因分型的新标准,推动从基础研究到精准医学的转化创新。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号