微生物与病毒宏基因组最新技术方法汇总

【字体: 时间:2014年08月14日 来源:生物通

编辑推荐:

  随着过去几年间,基因组测序读长越来越长,测序成本越来越低,研究人员已经开始雄心勃勃的编撰复杂微生物菌种,病毒毒株的基因组丰度和变异图谱。这种可以称之为宏基因组的研究方法首先需要从环境中收集这些微生物和病毒的细胞样品,然后进行破碎,将它们的基因组DNA降解成片段,然后通过测序仪进行分析。

  生物通报道:随着过去几年间,基因组测序读长越来越长,测序成本越来越低,研究人员已经开始雄心勃勃的编撰复杂微生物菌种,病毒毒株的基因组丰度和变异图谱。这种可以称之为宏基因组的研究方法首先需要从环境中收集这些微生物和病毒的细胞样品,然后进行破碎,将它们的基因组DNA降解成片段,然后通过测序仪进行分析。

宏基因组分析比一般的基因组分析需要更多的借助计算机技术,这是因为这分析的是不同的基因组混合物,而不是单纯的同质微生物菌群。由此宏基因组分析也产生了比一般基因组分析更多的数据,这也是这一研究领域的一大挑战,来自加州大学的进化生物学家 Jonathan Eisen表示。

不仅科学家们希望能了解微生物的特殊生存环境——考虑到这些微生物平均99%都没有被体外培养过,要做到这一点并不容易,而且他们也希望能了解这些微生物的功能,以及微生物相互之间如何竞争作用的。“测序成本不高,但是这并不是说简单把一个菌群放入测序仪中,就可以得到结果了,”Eisen说。

科学家们尝试利用一些改进的样品处理方法或分析方法,进行宏基因组复杂分析,尤其是一些计算机方法不断更新,能帮助研究人员们处理这些不断变大和变化的数据集。

近期The Scientist杂志汇总了一些用于微生物基因组数据分析的新技术方法与软件:

MEGAN5
ab.inf.uni-tuebingen.de/software/megan5
分类、功能分析,及比较分析

MEGAN主要用于MEtaGenome ANalyzer,最初是在2007年开发出来,用于识别长毛猛犸象骨中DNA测序研究的微生物污染。MEGAN5是去年发布的最新版本,除了可以帮助进行分类分析,也可以快速比较多个数据集,区分宏基因组中基因的功能,此外还提供元数据metadata支持和数据可视化的新途径。

如何开始:
在将数据导入MEGAN之前,研究人员需要通过BLAST,或相似的程序比对参考数据,对齐基因组数据的长度,这是这种分析最需要计算机帮助的一个部分。得到的数据导入到MEGAN(转化成MEGAN文件),然后研究人员就会看到这些数据读长已经与NCBI分类节点对齐。MEGAN包含了三个已建立的分析数据库:KEGG (Kyoto Encyclopedia of Genes and Genomes,京都基因和基因组百科全书)、SEED和 COG(Clusters of Orthologous Groups of proteins),这些数据库采用了不同方法进行基因功能分类。

初学者在学习了一个小时教程后就能很容易运行这一软件了,之后就是三个小时的软件演示。

目前还开发了一种新的运算方法(尚未发表),这种方法被称为DIAMOND,能将这种alignment步骤加速1.6万倍。一般来说通过BLAST运行一百万个读长需要44天。新技术开发者,来自德国图宾根大学的生物信息学家Daniel Huson说,“而这种新方法只需要四分钟,”他已经开始重新编写MEGAN,令其与DIAMOND同步。

注意事项:
相似工具:Qiime(发音为“chime”)与MEGEN功能相似,不过能帮助研究人员进行更为复杂的分析,但需要注意的是这种工具基于命令行,因此相比于MEGAN,生物学家更难以学会。

费用:
目前对科研目的用途免费开发。

也就是说,只要你有一台40多GB内存的计算机,那么就能进行相关分析。此外需要注意的是这一工具匹配的是KEGG老版本(2011版),由于KEGG目前不再免费,因此如果要用最新版本,就需要花费2,000美元购买。

未完待续

(生物通)

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号