PacBio发布目前最连续的二倍体人类基因组组装

【字体: 时间:2018年10月11日 来源:生物通

编辑推荐:

  Pacific Biosciences公司本周一宣布,它已经产生了到目前为止最连续的单个人二倍体人类基因组组装,表示遗传自父母双方的46条染色体的DNA序列近乎完整。

Pacific Biosciences公司本周一宣布,它已经产生了到目前为止最连续的单个人二倍体人类基因组组装,表示遗传自父母双方的46条染色体的DNA序列近乎完整。

此次使用的样本来自一名波多黎各的女性,她参与了之前的群体遗传学研究,如千人基因组计划。基因组测序在PacBio的Sequel系统上完成,利用的是2.1版本的试剂和5.1版本的软件。

据研究人员介绍,此次公开的组装(PacBio HG00733)与以往的组装相比有着最少的缺口,超过一半的基因组包含在长度超过27 Mb的无缺口contig中。contig组装的总长度达到2.89 Gb,由865个contig组成,是目前为止最连续的人类基因组组装。

研究人员利用FALCON-Unzip组装工具分析了超过80%基因组中的母本和父本单倍型。接着,他们利用Hi-C技术以及与Phase Genomics合作开发的FALCON-Phase方法来进一步定相母本和父本的单倍型区块,并利用Phase Genomics的Proximo Hi-C平台从头scaffold基因组,获得了第一个仅由两种技术完成的染色体规模的二倍体组装。

此次获得的基因组组装由46条染色体规模的scaffold组成,代表波多黎各个体的母本和父本染色体组。每组23条scaffold仅包含511个缺口,总长度达到2.83 Gb。每个单倍体基因组的剩余部分包含在260条长度为63 Mb的scaffold中。

PacBio的CEO Michael Hunkapiller表示:“在此之前,这种分辨率的人类基因组是无法实现的,目前只能由PacBio技术来实现。以前的测序方法无法区分23对染色体的序列,导致人类基因组组装的大小只有一半,而且混杂了父本和母本来源的DNA序列。如今能够分析每个亲本的单倍型序列,带来最完整的二倍体人类基因组视图。”

基因组参考序列联盟的成员Valerie Schneider表示:“在过去五年,基因组参考序列联盟一直在使用各种新技术(包括PacBio)产生的数据,以此来改进人类基因组参照序列的组装。这一新成就体现了目前可在个人基因组上实现的质量水平。”

当前版本的人类参考基因组组装(GRCh38)代表了嵌合单倍体序列,它是由50多名个体的DNA测序数据组合而成。相比之下,PacBio HG00733二倍体基因组组装分析了母本和父本染色体序列,并囊括了波多黎各群体特有的多样性。(生物通 薄荷)

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号