测序过程中出现“流氓基因”污染

【字体: 时间:2015年10月14日 来源:生物通

编辑推荐:

  Supratim Mukherjee在进行数据分析的时候,发现数以百计的微生物基因组中会重复出现同一种噬菌体序列,这令他感到很惊讶。这位来自劳伦斯伯克利国家实验室的生物信息学家最开始是为了比对这些微生物的代谢途径,但后来他发现了几乎无处不在的序列,“我以为我们发现了一些新的东西,”他回忆道,“在这些不同的微生物中,这整个噬菌体基因组是完整地保留下来的。”

  ——一些研究表明,目前已经公布的基因组存在多种污染,随着这个问题越来越突出,我们需要找出方法来应对

生物通报道:Supratim Mukherjee在进行数据分析的时候,发现数以百计的微生物基因组中会重复出现同一种噬菌体序列,这令他感到很惊讶。这位来自劳伦斯伯克利国家实验室的生物信息学家最开始是为了比对这些微生物的代谢途径,但后来他发现了几乎无处不在的序列,“我以为我们发现了一些新的东西,”他回忆道,“在这些不同的微生物中,这整个噬菌体基因组是完整地保留下来的。”

但当Mukherjee一开始分析这个噬菌体序列时,他就知道这就是 PhiX 序列,一种Illumina公司测序试剂盒中用做标准品的噬菌体。PhiX 本来是作为一种质控检测指标,用于追踪每个测序过程中出现的错误率的,但在上百个案例中,Mukherjee发现研究人员都没有从其公布的基因组序列中剔除Phi X的序列。

并不是只有Mukherjee一人发现此种情况,最近大量的报告表明,发表的基因组出现污染要比之前想象的多得多。那么这些污染是如何出现的呢?我们又能做些什么,避免这些情况的出现呢?

就此The Scientist杂志请教了几位研究人员,他们分享了他们的一些Tips,可以检测和预防出现“流氓序列”。

广泛的基因污染

在Mukherjee 研究组意识到 PhiX 污染可能会出现了多个公布的微生物基因组中之后,这一研究组觉得量化其出现频率。通过分析调查,Mukherjee等人发现在已出版的1.8万个细菌和古细菌基因组(Integrated Microbial Genomes database)中,超过1000个序列被PhiX 序列污染。今年Mukherjee等人已经将这一发现公布在Standards in Genomic Sciences上。而这些其中的10%也出现在了同行评审的期刊杂志中。

PhiX 污染还只是冰山一角——现在问题呈指数级增长,NCBI总监David Lipman说,他也正在筛选过去五年间,呈递到GenBank中的数据。

“我们检测到2012年细菌和古细菌的污染情况还只有2%-3%,” Lipman说,“但之后就急速攀升,到2014年,已经接近了10%。今年到目前为止,这一比率达到23%”。

Sanger研究所的科学家们也发现,DNA提取试剂盒、化学试剂和实验室环境中的杂菌很容易造成污染,影响微生物组分析的结果。

研究人员发现,没有污染的话对照样本应该只有一种菌,但有时却出现了270种不同的细菌。与高生物量的样本相比(粪便样本),来自血液或肺部的低生物量样本尤其容易受到污染。

“现在的DNA测序技术允许人们进行深度测序,被广泛用于稀少微生物群体的分析。我们发现,这类样本很容易被其他来源的DNA污染,要么在收集样品的时候,要么在DNA提取和扩增过程中。污染会对研究结果产生很大的影响,这一点需要研究者们给予足够的重视,”Sanger研究所的Alan Walker博士说。

而且微生物也不是唯一出现这么多污染的研究领域,去年伦敦大学学院的计算机专家William Langdon发现,千人基因组计划中至少7%受到了支原体遗传物质的污染(BioData Mining, 7:3, 2014),因此如果说你对污染的基因组感到头疼的话,放心,你不是唯一一个。

未完待续……

 

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号