第三代单分子测序的开山之作[创新技巧]

【字体: 时间:2009年08月12日 来源:生物通

编辑推荐:

  斯坦福大学的科学家最近利用Helicos Biosciences的Heliscope单分子测序仪,对一名白人男子的基因组进行了测序,文章发表在最新一期的《Nature Biotechnology》在线版上。这次测序花了4个星期的时间,试剂花费为48000美元。

斯坦福大学的科学家最近利用Helicos Biosciences的Heliscope单分子测序仪,对一名白人男子的基因组进行了测序,文章发表在最新一期的《Nature Biotechnology》在线版上。

斯坦福大学的生物工程师Stephen Quake,同时也是Helicos的创始人之一,对他本人的基因组进行了测序。在两名研究人员的协助下,他利用一台Heliscope测序仪和4次数据收集运行,完成了此次测序。

研究人员报告称,他们产生了数十亿个Heliscope序列读取,覆盖了90%的人参考基因组,覆盖度达28倍。序列读长为24到70个碱基,平均读长为32个碱基。到目前为止,他们已经鉴定出280万个SNP和752个拷贝数变异。

这次测序花了4个星期的时间,试剂花费为48000美元。Quake认为,这些工作在普通的实验室中就能完成,只需要一台仪器,费用也适中。另一名研究人员Neff表示,Heliscope的主要优势在于高产量以及文库制备简单,不需要DNA扩增或连接。“如果有三台Heliscope,我一个星期就能完成。”

Neff解释道,因为有小部分核苷酸未标记上,在测序过程中出现了一些“暗色”的核苷酸,好像缺失一样。研究小组利用Helicos软件来协助碱基检出,并通过增加基因组覆盖度来校正缺失的错误。与参考基因组比对之后,他们发现读取片段覆盖了25亿个碱基,大约90%。

为了帮助检出SNP,另一位作者Pushkarev开发出一种UMKA算法。这个算法预测出基因组中的2805471个SNP。其中大约76%也在dbSNP中找到。他们还将鉴定出的SNP与Illumina Human610-Quad SNP BeadArray检测到的结果进行比较,发现两种方法的一致性为99.8%。此外,研究人员还用Sanger测序验证了其中100个SNP。他们还发现了基因组中的752个CNV,其中超过半数出现在基因组变异数据库中。

作者们也提到这种测序方法仍有缺陷,包括基因组覆盖不完整,缺乏SNP和结构变异的完整数据。

Helicos的副总裁Patrice Milos表示:“显然,这是Steve Quake的里程碑式文章,同时这也是Helicos的里程碑式文章。我们着实兴奋和激动。”他认为Helicos一直致力于开发容易运行的仪器,且前期的样品制备简单,这样小型实验室也能进行基因组测序。

下一步,研究小组还将与斯坦福干细胞生物学和再生医学研究院合作,利用Heliscope对癌症基因组进行测序。

原文摘要:

Single-molecule sequencing of an individual human genome
Dmitry Pushkarev, Norma F Neff & Stephen R Quake
Nature Biotechnology  Published online: 10 August 2009 | doi:10.1038/nbt.1561

摘要:
Recent advances in high-throughput DNA sequencing technologies have enabled order-of-magnitude improvements in both cost and throughput. Here we report the use of single-molecule methods to sequence an individual human genome. We aligned billions of 24- to 70-bp reads (32 bp average) to  90% of the National Center for Biotechnology Information (NCBI) reference genome, with 28  average coverage. Our results were obtained on one sequencing instrument by a single operator with four data collection runs. Single-molecule sequencing enabled analysis of human genomic information without the need for cloning, amplification or ligation. We determined  2.8 million single nucleotide polymorphisms (SNPs) with a false-positive rate of less than 1% as validated by Sanger sequencing and 99.8% concordance with SNP genotyping arrays. We identified 752 regions of copy number variation by analyzing coverage depth alone and validated 27 of these using digital PCR. This milestone should allow widespread application of genome sequencing to many aspects of genetics and human health, including personal genomics.

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号