鱼和熊掌兼得,PacBio获得高度准确的长reads

【字体: 时间:2019年01月17日 来源:生物通

编辑推荐:

  如今,人类基因组的测序已经达到群体规模,但仍需要结合不同的测序技术(短读长和长读长),才能覆盖各种类型的遗传变异。这无疑增加了测序项目的成本和复杂度。为此,Pacific Biosciences公司的研究人员开发出一种方案,能够在Sequel测序平台上产生高度准确的长reads。

如今,人类基因组的测序已经达到群体规模,但仍需要结合不同的测序技术(短读长和长读长),才能覆盖各种类型的遗传变异。这无疑增加了测序项目的成本和复杂度。为此,Pacific Biosciences公司的研究人员开发出一种方案,能够在Sequel测序平台上产生高度准确的长reads。

在PacBio、Google、NIST等机构的共同努力下,研究人员对人类男性HG002样本进行了测序,覆盖度达28倍,平均读长为13.5 kb,且准确性高达99.8%。这项成果于本周发表在预印本网站bioRxiv上。PacBio公司的David Rank和Michael Hunkapiller为共同通讯作者。

“一项具有长读长和高准确性的测序技术将让研究人员在单次实验中全面发现变异,”作者在文中写道。他们证实了这种方案在检测小片段和大片段变异以及基因组组装和单体型定相上媲美甚至超越现有技术。

研究团队以环状一致测序(CCS)为基础开发出一种方案。CCS通过反复通读环化模板而获得一致序列,从嘈杂的subreads中产生准确的reads。“最近SMRT测序的读长增加和经过优化的DNA模板制备为高准确性和长读长的统一提供了机会,”他们写道。

研究人员通过测序和分析人类男性HG002样本来评估这个方案的表现。HG002样本是瓶中基因组(GIAB)联盟的基准样本之一。GIAB提供了物理参考材料以及样本基因组的详细鉴定,定义了“高度可信的区域”和“高度可信的变异”。

他们在PacBio Sequel测序平台上开展了基因组测序,覆盖度达到28倍。读取准确性达到99.8%,与通常的短读长测序准确性不相上下。他们补充说,这些reads的从头组装产生了高度连续和准确的基因组,contig N50超过15 Mb,一致性为99.998%。

研究人员还分析CCS reads,以检出SNV、插入缺失和结构变异,并开展单体型定相。对于变异的检测,CCS的表现与30倍的短读长测序相当。其中,SNV的检出率为99.91%,插入缺失为95.98%,而结构变异为95.99%。正如作者所说,几乎所有的变异都定相到单体型,这进一步改善了变异检测。

此方案不仅仅有出色的质量结果,还具备许多其他的优点。具体包括样本制备过程更轻松(因为不需要超长的基因组DNA),计算时间缩短,以及能够使用专为准确reads而设计的熟悉工具GATK。

作者认为,未来的改进 – 包括时间缩短和通量增加 – 将促进快速的群体规模基因组分析,并改善人类健康。除了人类基因组学方面的应用,这种方案也有望应用在宏基因组学以及动植物基因组的组装。(生物通 薄荷)

原文检索

Highly-accurate long-read sequencing improves variant detection and assembly of a human genome

doi: https://doi.org/10.1101/519025

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号