Cell:千人基因组计划(1kGP)资源上新扩容 高覆盖度全基因组测序发现更多SNVs、INDELs、SVs

【字体: 时间:2022年09月03日 来源:broad institute

编辑推荐:

  利用高覆盖率的全基因组测序和改进的分析方法,科学家们对该项目的样本进行了高覆盖度重测序,样本队列现扩展至3202个样本,其中包含602个家系三人组。文章发表在《Cell》上,令这一开放获取资源更加有价值。

  

七年前,千人基因组计划(1kGP)公布了一个开放获取的资源——来自世界五大洲26个种群的2504个个体的低覆盖率全基因组测序(WGS)数据,是首次大规模公开的人类遗传变异目录。在那之后,纽约基因组中心的研究人员与马萨诸塞总医院、耶鲁大学和人类基因组结构变异联盟(HGSVC)的团队合作,在原有样本的基础上扩大了千人基因组计划资源——将该队列扩展到3202个样本,其中包括602个亲子三人组;并使用Illumina NovaSeq仪器对他们重新进行高覆盖度测序。该研究发表在《Cell》杂志上,对扩大的1kGP队列的高覆盖率WGS数据进行了全面分析。

纽约基因组中心计算生物学科学主任、该研究的资深作者Michael Zody表示:“1000基因组计划队列是如此宝贵的资源,我们认为,使用最新版本的短读技术将测序更新到最新水平,同时提高了以前遗漏的家族样本的丰富程度,这对研究群体是有用的。”

纽约基因组中心的研究人员使用最先进的方法和算法,对扩大队列的淋巴母细胞细胞系(来自外周血的永生人类B细胞)提取的DNA进行了测序,目标深度为30X基因组覆盖。接下来,研究小组进行了单核苷酸变异(SNV)和短插入和删除(INDEL)识别检出,其中包括从相对于人类基因组参考的序列数据中识别变异位点,并对队列中所有样本中发现的变异位点进行基因分型。来自哈佛医学院Michael Talkowski团队、麻省理工学院和哈佛大学Broad研究所和麻省总医院的团队,与耶鲁大学和华盛顿大学医学院的Ira Hall团队以及HGSVC合作,通过整合多种分析方法,对3,202个样本中发现的一组结构变异(SVs)综合集合进行了基因分型。

总的来说,该研究表明对变异识别的发现能力和精度都有了显著提高,尤其是在罕见的SNV、INDELs和SVs之间,这些是以前低覆盖测序无法实现的。

原始千人基因组计划资源的一个重要方面是它经常被用作变异体imputation的参考panel,即根据从参考panel中了解到的、在群体中通常一起遗传的变异体分组,对在数量较少的阵列样本中新观察到的基因型进行统计推断,这促进了大量的全基因组关联研究(GWAS)。现在,该团队扩展了原始资源,升级了参考imputation panel,使之包括了通过高覆盖度全基因组测序和家系三人组发现的更多变异体。

纽约基因组中心的高级生物信息学科学家、该研究的共同第一作者Marta Byrska-Bishop解释说:“新的imputation panel包括更多的位点,特别是许多更常见的INDELs和SVs,从而扩大了GWAS可用的变异数,鉴于非SNV变异的大效应量,很可能会发现新的遗传关联,帮助确定致病变异。”“我们的目标是让这一公共资源成为未来人群遗传学研究和方法发展的基准,”麻省总医院和布罗德研究所基因组医学中心的博士后研究员、该研究的共同第一作者Xuefang Zhao补充说。

测序完成后,所有原始序列数据和变异体调用集立即通过几个基因组数据存储库向公众发布,包括国际基因组样本资源,该资源由欧洲分子生物学实验室的欧洲生物信息学研究所的合著者维护。这些数据已经引起了遗传学和基因组学界的关注。由于千人基因组样本的完全开放获取特性,这种情况可能会在未来几年继续下去。与WGS的大多数新工作不同,1kGP样本同意公开分发基因数据,不受获取或使用限制。


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号