Nature子刊:基因组完美装配的新方法

【字体: 时间:2013年05月07日 来源:生物通

编辑推荐:

  现在,DOE JGI、PacBio公司和华盛顿大学合作,开发了一种改良版的基因组装配方法,文章于五月五日发表在Nature Methods杂志上。研究人员将鸟枪法DNA文库与单分子实时DNA测序(SMRT技术)结合起来,对三种微生物基因组实现了高质量的从头装配。

  

生物通报道:美国能源部联合基因组研究所DOE JGI是微生物基因组测序的先驱,致力于在生物能源和环境领域开发微生物的潜在应用价值。同时,DOE JGI的科学家们也在努力开发新的工具,以便对基因组进行更经济有效的装配和序列分析。

近年来,DNA测序的通量显著增加,测序成本不断降低,但基因组装配仍面临着不小的挑战。现有技术一般是先通过测序得到DNA序列的短片段,然后利用计算机方法将其组装成长片段,从而确定序列顺序并对目标序列进行研究。这样的装配相当于,要在不知道最终图形的情况下,完成数百万片的拼图。如何将这些大量短片段有效组装起来,一直是基因组装配面临的一大难题。

现在,DOE JGIPacBio公司和华盛顿大学合作,开发了一种改良版的基因组装配方法,文章于五月五日发表在Nature Methods杂志上。研究人员将鸟枪法DNA文库与单分子实时DNA测序(SMRT技术)结合起来,对三种微生物基因组实现了高质量的从头装配。

该技术名为分级基因组装配HGAPhierarchical genome-assembly process),是一种“从DNA样品制备到完成基因组的全自动工作流程”。PacBio公司的单分子实时DNA测序平台,能够生成超长的测序读段,HGAP技术正是得益于此。

Sanger测序技术能够很好的覆盖测序中的缺口,精确度非常高。传统的Sanger测序技术需要创建多个DNA文库,进行多次测序,并且要整合大量数据。目前人们往往将Sanger方法与其他测序技术结合起来,以便获得最优化的结果,不过这样的方法一般仍然需要制备多个文库。研究人员指出,HGAP技术只需要制备一个鸟枪法DNA文库,而且不需要用高精度的原始读段来进行校正。

研究团队用DOE JGI之前测序过的三种微生物,对HGAP技术进行验证。他们将从头组装的结果与微生物的参考序列相比较,发现HGAP技术的装配结果精确度大于99.999%

“我们一直在寻求新途径,希望帮助研究者们有效获得高质量的数据,”DOE JGILen Pennacchio说。DOE JGI参与了20%的全球基因组测序项目,包括微生物、植物、真菌、藻类等,大多集中在环境生物学、能源等领域。

“在JGI专家的帮助下,我们改进了单分子测序的基因组装配方法,生成了可以与Sanger金标方法媲美的高质量完成基因组。”文章的通讯作者,PacBio公司的Jonas Korlach说。

现在研究团队正在努力拓展HGAP技术的应用,希望将其用于复杂生物的基因组装配。

 

(生物通编辑:叶予)

生物通推荐原文摘要:

Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data

We present a hierarchical genome-assembly process (HGAP) for high-quality de novo microbial genome assemblies using only a single, long-insert shotgun DNA library in conjunction with Single Molecule, Real-Time (SMRT) DNA sequencing. Our method uses the longest reads as seeds to recruit all other reads for construction of highly accurate preassembled reads through a directed acyclic graph–based consensus procedure, which we follow with assembly using off-the-shelf long-read assemblers. In contrast to hybrid approaches, HGAP does not require highly accurate raw reads for error correction. We demonstrate efficient genome assembly for several microorganisms using as few as three SMRT Cell zero-mode waveguide arrays of sequencing and for BACs using just one SMRT Cell. Long repeat regions can be successfully resolved with this workflow. We also describe a consensus algorithm that incorporates SMRT sequencing primary quality values to produce de novo genome sequence exceeding 99.999% accuracy.

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号