NGS,真的是*优之选么?[心得点评]

----Affymetrix的HTA 2.0芯片最新文献解析

【字体: 时间:2013年09月06日 来源:

编辑推荐:

  今年,Affymetrix公司推出了HTA 2.0(Human Transcriptome Array 2.0)芯片,该芯片是迄今为止密度*高、功能*全的商业化基因表达芯片,可以实现编码RNA和非编码RNA转录本检测、可变剪切分析以及基因水平和外显子水平的基因表达分析。今年七月应用该芯片发表于Cancer Discovery的*新文献表明,HTA 2.0可以比RNA-seq获得更多的选择性拼接信息,并且与qRT-PCR验证结果完全一致。

在高通量基因组学技术中,下一代测序技术(Next Generation Sequencing, NGS)和基因芯片技术(GeneChip 或Microarray)都是研究者非常熟悉的。在很多的研究中,这两者各自发挥着其优势和功能,并且在很多研究中联合使用两种技术,互为补充,相得益彰。

NGS主流的三家技术分别来自于Roche、Illumina以及刚刚收归于Thermo Fisher旗下的Life Technologies。其共同特点是通过文库构建及基于单个分子的PCR扩增来读取和获得样品分子的碱基序列。由于NGS的高通量,高速度以及可以获得目标分子的碱基序列等优势,在近几年中迅速得到全世界研究者的青睐和认可。无论是在DNA水平的de novo测序,重测序,宏基因组测序以及甲基化分析还是RNA水平的基因表达差异分析,外显子拼接分析,融合基因表达分析以及非编码RNA测序等,NGS技术都有广泛应用。

基因芯片技术从原理上讲,基于探针杂交的方法,通过DNA-DNA或DNA-RNA的互补结合来检测目标分子。作为发展多年的成熟基因组学技术,也一直受到研究者的青睐,尤其在基于基因分型的GWAS分析,拷贝数变异分析,基因表达谱分析中,具有实验流程简单,分析方法成熟,性价比高,重复性好等诸多优势。

在选择基因组学技术的时候,往往有些研究者会比较困惑如何选择合适自己的技术,甚至有时会盲目跟风,追求更新,更“时髦”的NGS,认为测序处处优于芯片,并且可以将芯片取而代之。那么事实是否如此?NGS真的是*适合,*优的选择么?让我们先从今年7月刚刚发表的一篇文章说起。

Cancer Discovery. 2013 Jul 16. (2012年影响因子10.143)
SF3B1 mutations are associated with alternative splicing in uveal melanoma.

该杂志成立于2011年,2012年才开始有影响因子,并且成为了2012年涨幅*快的前十位杂志之一。所以该文献的结果是很有说服力的。

这篇文章是通过几种基因组学技术来解析葡萄膜黑色素瘤(uveal melanoma,一种眼部肿瘤)可能的遗传学病因,也就是为了找到致病基因。其研究思路大体如下:

首先,在DNA水平,作者采用SNP芯片进行染色体拷贝数的分析,同时用全基因组测序一方面分析拷贝数变异,结果与芯片基本一致,另一方面同时分析单碱基突变,并且结果均通过Sanger法测序验证。两实验的拷贝数分析均表明在这些病人中发现的拷贝数变化水平和结构变异频率都很低。而检测基因突变发现主要突变的基因有SF3B1(本文研究重点), GNAQ, GNA11(这两个是主要的该疾病的致癌基因)和BAP1(肿瘤抑制因子)。后面三个基因以前都有研究与该疾病相关,SF3B1是新的发现。所以作者主要针对该基因进行功能研究。

SF3B1编码Splicer factor 3b的一个亚基,这是剪接体的一个重要组分。剪接体的功能是将前体mRNA剪接成成熟的mRNA,而Splicer factor 3b的功能正是让前体mRNA锚定于剪接体上。

第二步,通过Affymetrix的HTA 2.0芯片在SF3B1突变和正常的肿瘤中检测和比较基因表达差异及选择性拼接差异,在表达水平上发现了325个基因发生了变化,其中46个上调基因,279个下调基因,后续的GO分析和信号通路KEGG分析没有发现显著相关的GO terms(基因功能)和信号通路。于是对外显子拼接水平分析,发现SF3B1突变后,明显影响到了8个重要疾病相关基因的RNA拼接方式,*终导致形成不同的转录本形式和功能。正因如此,SF3B1突变和不突变的病人,其预后效果完全不同,这对于疾病的治疗有重要意义,也为后续实验指明了重要的研究方向。

接下来,作者又通过以往他人研究的RNA-seq结果进行分析。发现8个基因中的6个在Harbour等人的结果中发现了一致结果,也就是6个基因拼接方式发生了改变,而在作者自己的RNA-seq实验中发现了8个中的3个。而qRT-PCR验证的结果则完全与芯片一致,证实了8个基因发生了选择性剪接。这说明HTA 2.0芯片可以比RNA-seq发现更多的发生选择性剪接的基因,并且全部通过了RT-PCR这一黄金标准的验证。结果如下图所示。


 
所以,通过本文的实验,我们不难发现,无论是DNA水平还是RNA水平,作者都广泛的采用了基因芯片与NGS两种技术相结合,而非有些研究者那样,盲目的追风,一味的认为NGS可以解决一切问题。本文中,DNA水平发现单碱基变异是NGS的长项,芯片做不到;而分析拷贝数变异,芯片毫不逊色。在RNA水平,基因表达量变化及外显子拼接对芯片来说都是轻而易举的事情,并且数据分析难度,实验成本,对研究人员的要求等都要显著低于RNA-seq,并且在选择性拼接的实验结果中,RNA-seq的两次实验只分别检出了HTA 2.0芯片结果发现的8个基因中的6个和3个,而金标准RT-qPCR结果与芯片一致。所以,基因芯片技术与NGS技术并非水火不容,实际上二者有着各自的长项和优势,究竟选择哪一种或是组合,要根据具体实验需求而定,而非一概盲目的选择NGS。尤其在RNA领域,芯片仍然是主流和高性价比的技术。

*后,我们来看一下HTA 2.0芯片与RNA-seq相比的特色所在。

欢迎索取Affymetrix HTA 2.0芯片的更多资料


 

图1. 对于RNA-Seq,测序的深度以及表达水平都影响精确性;GeneChip® Human Transcriptome Array 2.0(HTA)无论转录本丰度高低均能提供精确的基因表达数据。

图中显示了转录本表达水平的中值(x轴,log2 Reads Per Million,RPM)和检测的CV值(y轴,Coefficient of Variation)的关系,其中红点及其拟合曲线(红线)为HTA基因表达芯片结果,蓝点及其拟合曲线(蓝线)为Illumina® HiSeq™ 2000系统测序结果(RNA-Seq,100+100 bp read-pairs),分别从基因水平和外显子水平分析了转录本表达水平。结果表明,所有的RNA-Seq数据(除了*深度的测序之外)都显示出了明显的背景噪音,因此将会遗漏重要的差异表达信息。
(A) = 1/8 HiSeq lane, 30 million mapped reads
(B) = 1/2 HiSeq lane, 120 million mapped reads
(C) = 2 HiSeq lanes, 480 million mapped reads


 
图2. RNA-Seq的准确性取决于测序深度。GeneChip® Human Transcriptome Array 2.0(HTA)提供了准确的结果,其准确性相当于2个Lane的RNA-Seq数据。

通过一个线性样本混合物模型(Linear Tissue Mixture Model)评估了所有外显子的表达水平检测的准确性,该模型根据预先设定的比例混合两个RNA标准品。y轴是检测错误或(D-C)/(B-A))的MAD (Mean Absolute Deviation, 平均绝对偏差)的绝对值,其中标准品A=Universal Human Reference RNA(UHRR),Agilent Technologies, Inc.;标准品B=Human Brain Reference RNA (HBRR),Life Technologies, Inc.;C=75%A+25%B;D=25%A +75%B。 HTA芯片提供的全转录组基因表达测定的准确性相当于HiSeq™ 2000系统上2个Lane测序数据所带来的准确性。

图3. GeneChip® Human Transcriptome Array 2.0(HTA)带来了*全面的转录组分析。对于一个基因的全面分析需要整合多个数据库来源的转录本异构体信息。一个典型的基因(LMNB1,如图所示)包含了许多转录本异构体,测定每个转录本异构体相对丰度的变化为疾病和生物学研究提供了新的启示。HTA提供了外显子和亚外显子水平的表达变化分析,同时能检测可变剪切所产生的转录本异构体。每个独特外显子区域都设计了10条探针以检测一个基因所有转录本异构体。此外,HTA为每个已知的可变剪切位点设计了4条特异的探针(未在图中显示),每个基因平均有140条探针。通常RNA-Seq实验只和RefSeq数据库进行比对分析,在这个例子中,LMNB1基因只有3个转录本异构体可以通过RNA-Seq检测到(第2、3和13条转录本异构体)。HTA整合了多个数据库的内容,实现了所有的15个转录异构体的全面分析。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号