新技术:破解RNA测序的方方面面(一)[选购宝典]

【字体: 时间:2010年09月20日 来源:生物通

编辑推荐:

  随着新一代高通量DNA测序技术的快速发展,RNA测序(RNA-seq)已成为基因表达和转录组分析新的重要手段,并且随着RNA的重要性逐渐被人所认识,研究人员也开发出多种方法来研究它。但是许多方法仍需将RNA反转录成cDNA,而这一步会引入错误,且效率不高。近期一些研究小组开发出了RNA测序新技术

生物通报道:自2005年以来,以Roche公司的454技术、Illumina公司的Solexa技术和ABI公司的SOLiD 技术为标志的新一代测序技术相继诞生,新一代测序技术又称作深度测序技术,主要特点是测序通量高,测序时间和成本显著下降。把这种高通量测序技术应用到由mRNA 逆转录生成的cDNA上,从而获得来自不同基因的mRNA片段在特定样本中的含量,这就是mRNA测序或 mRNA-seq 同样原理,各种类型的转录本都可以用深度测序技术进行高通量定量检测,统称作RNA-seq或RNA测序。

随着新一代高通量DNA测序技术的快速发展,RNA测序(RNA-seq)已成为基因表达和转录组分析新的重要手段,并且随着RNA的重要性逐渐被人所认识,研究人员也开发出多种方法来研究它。但是许多方法仍需将RNA反转录成cDNA,而这一步会引入错误,且效率不高。近期一些研究小组开发出了RNA测序新技术。

可消除转录组分析偏误的RNA测序技术

了解基因组的功能输出(一个细胞或细胞群中的全部信使RNA,被称为转录组),是生物学研究过程中的一个必要步骤。当前研究转录组的方法依赖于微阵列和测序方法,它们需要合成互补DNA,之后再进行多种操作,这样会引入偏误和潜在的人为结果。

研究人员利用单分子测序技术来进行RNA直接测序,这将有助于更为详细地了解有多少基因组被转录、每个基因产生了多少RNA变异。这种转录组分析方法的局限是它需要成百上千的细胞。

研究人员为了让“边合成边测序”的反应适应直接的RNA测序,优化了使用的聚合酶到缓冲液,并利用专利的荧光核苷酸类似物,从而能在poly(dT)包被的表面捕获聚腺苷酸化的RNA,并利用大肠杆菌poly(A)聚合酶I来进行边合成边测序的步骤。

首先研究人员对一段40个碱基的RNA序列进行测序,来检验这种方法。大约一半(48.5%)的读长是20个核苷酸或更长。最长的无误差读数是38个碱基。随后他们将注意力转向酿酒酵母这种模式生物。因为酿酒酵母的大部分RNA本身就存在聚腺苷酸化,所以她们不需要在测序前再加上poly-A尾巴。

在这个实验中,研究小组产生了41261个读数,每个约为20个核苷酸或更长。近一半(48.4%)的读数与酵母基因组配对。90%以上的配对读数是位于已知的酵母开放读码框3’端的400个核苷酸内。实验过程中,研究人员意外地检测到酵母RNA 3’端的异质性。她们还发现证据,暗示至少有一些酵母核糖体RNA和小核仁RNA(snoRNA)是聚腺苷酸化的。

研究人员称这种RNA直接测序方法目前的错误率约为4%,大部分是黑暗碱基(dark base)引起的缺失。插入的错误率为1-2%,而替换的概率只有0.1-0.3%。

高通量RNA测序

转录组提供了有关活性基因的功能、调控和互相依赖的信息。最近科学家们将高通量测序仪应用于转录组分析(RNA-Seq),新方法让研究人员能够更为详细地了解有多少基因组被转录、每个基因产生了多少RNA变异。这种转录组分析方法的局限是它需要成百上千的细胞。

研究人员将转录组分析方法应用到单个细胞的分析中,并以前所未有的精度分析了取自四细胞胚胎和卵母细胞的单个老鼠细胞的转录组。新方法不仅对发育生物学的研究至关重要,而且也让科学家们能够在胚胎发育的早期深入研究单个细胞中全部基因表达、研究复杂组织中的细胞异质性,并在单个细胞的水平上分析疾病的发展。

RNA测序数据处理

RNA-seq 技术产生的海量数据为生物信息学带来了新的机遇和挑战,有效地对测序数据进行针对性的生物信息学处理和分析,成为 RNA-seq技术能否在科学探索中发挥重大作用的关键。

很多 RNA-seq 实验的目的是为了比较两种或多种样本中基因表达或整个转录组的差异,如比较癌症组织和正常组织的转录组差异等。这些差异既包括通常意义下的差异表达基因,也主要包括选择性剪接模式的差异、剪接异构体表达的差异、非编码转录本的差异等。这些差异一般可以用一些统计假设检验方法检测,但这种检验有时会受到测序深度、基因长度等因素的影响,需要对结果进行仔细分析,消除可能的混杂因素,必要时可以用读段的绝对表达值倍数变化(fold-change)来作为补充。

产品

目前,在已经推出的几种新一代测序平台中,Illumina/Solexa测序平台上的RNA-seq应用较广,Illumina/Solexa 测序技术的基本原理是边合成边测序(sequencing by synthesis,SBS) ,即测序过程是以DNA单链为模板,在生成互补链时,利用带荧光标记的dNTP发出不同颜色的荧光来确定不同的碱基,新加入dNTP的末端被可逆的保护基团封闭,既保证单次反应只能加入一个碱基,又能在该碱基读取完毕后,将保护基团除去,使得下一个反应可继续进行,为了增加荧光强度,使之更易被成像系统所采集,该技术在测序之前还需要对待测片段做桥式扩增(bridge amplification)。

初期的 Illumina/Solexa 测序技术只能在较短的测序读长上(20-30 碱基)保证较高的正确率,随着技术的改进,目前的读长已经增加到100碱基以上。同时,随着双端测序(paired-end,PE)技术的成熟,测序长度更可达到单端测序的2倍,测序通量也随之增加。这种测序技术是Solexa 公司发展起来的,2007 年被Illumina 公司收购,因此现在通常被称为 Illumina/Solexa 测序技术。

近两年来,Illumina/Solexa 测序平台不断升级,相继推出了 GA(Genome Analyzer)、GA IIx、HiSeq 2000等测序仪。

(生物通:万纹)

原文摘要:
Brian J Haas & Michael C Zody. (2010) Advancing RNA-Seq analysis, Nature Biotechnology, 28(5): 421-423.

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号