PNAS:结合二代测序和三代测序来鉴定异构体

【字体: 时间:2013年12月02日 来源:生物通

编辑推荐:

  斯坦福大学Wing Hung Wong领导的研究小组将Illumina与PacBio的测序技术结合起来,来解决异构体鉴定和定量的问题。这篇题为“Characterization of the human ESC transcriptome by hybrid sequencing”的文章于11月26日发表在《PNAS》在线版上。

  

2008年,第一篇介绍RNA-seq的文章在《Nature Methods》上发表。这五年来,RNA-seq技术正逐渐取代芯片,广泛应用于基因表达研究中,也带来了许多新的应用。然而,就目前流行的二代测序而言,mRNA异构体(isoform)的鉴定仍是个挑战。

对于转录组分析而言,异构体的鉴定和发现是个重要的目标,因为大多数人类基因表达多个异构体,它们具有背景或组织特异的功能。目前,Illumina技术的读长大约在100-250 bp,这远远小于人转录本的平均长度(~2500 bp)。短的读取让人难以鉴定和定量异构体。而另一方面,三代测序尽管产生了很长的读取,但在原始数据准确率和通量上仍不尽如人意。

为此,斯坦福大学Wing Hung Wong领导的研究小组将Illumina与PacBio的测序技术结合起来,来解决异构体鉴定和定量的问题。这篇题为“Characterization of the human ESC transcriptome by hybrid sequencing”的文章于11月26日发表在《PNAS》在线版上。

在这项研究中,研究小组开发出一种新的计算方法,称为异构体检测和预测(Isoform Detection and Prediction,IDP)。它将Illumina短读取的准确性与PacBio经过错误校正的长读取相结合,用于异构体的检测和定量。

这种IDP方法使用经过错误校正的PacBio长读取来鉴定可能的异构体。由于PacBio平均读长约在2-3 kb,有些甚至超过8 kb,它们善于发现长的异构体。作者还使用从Illumina读取中获得的剪接点,来预测可能的异构体。

以人胚胎干细胞(hESC)为研究对象,他们报告了8,084个RefSeq注释的异构体,以及5,459个通过统计推断预测的异构体。超过三分之一都是新的异构体,包括273个来自基因位点的RNA,之前未曾被鉴定出。

作者还开发出一种新的统计方法,来定量候选异构体的表达。他们不止是利用Illumina读取的比对来定量异构体的丰度,而是在Maximum A Priori(MAP)设置下利用PacBio的数据作为先验,再利用Illumina估计其丰度。这与Wing Hung Wong小组早期开发的方法非常相似。

通过这一系列研究,作者得出结论,即使是研究透彻的人类细胞系和组织,基因鉴定的工作也远远没有完成。(生物通 薄荷)

原文检索

Characterization of the human ESC transcriptome by hybrid sequencing

Published online before print November 26, 2013, doi: 10.1073/pnas.1320101110

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号