基因芯片探针设计与杂交条件的优化策略[心得点评]

【字体: 时间:2001年07月03日 来源:

编辑推荐:

  

基因芯片探针设计与杂交条件的优化策略


前言

    快速发展的微阵列技术为生物医学研究领域带来革新性影响,使研究者可同时对某一细胞样品进行几乎所有mRNA转录物的检测。高通量、平行的发现结果使得以下几个方面的研究成为了可能:
    检测在不同病理和生理状况下许多基因的表达水平的改变;
    对某一特殊的、经过治疗的细微反应变化进行监测。

    微阵列技术中有许多种方式可以使得不同表面化学偶连DNA分子,还有不同的分析条件和数据分析工具,一个有效的微阵列平台应该具备以下条件:
    * 灵敏:可以从一个复杂的背景中辨认出稀有表达产物;
    * 特异:可将两个不同的基因家族进行区分;
    * 量化:可以进行数据自动化处理。

    两条核酸链的杂交效率受储多因素的影响,如:它们的复性效果决定了一个微阵列实验的灵敏度和特异性。Affymetrix公司在对这些影响因素进行了深入、详细的探讨。主要从以下几个方面进行:
    * 序列影响因素:长度、互补序列长度、序列碱基成份
    * 非序列影响因素:探针和靶序列浓度、时间、温度、阳离子浓度、化合价及特征、pH、等电点、缓冲液、固相支持物性质、表面探针的密度等。
    * 样品背景的影响因素:任何探针序列,甚至在以上因素优化的条件下,都有可能与样品中的互补靶序列相互作用,尽管有时互补靶序列较短或是某一小段,这将产生非特异性的背景,降低检测的特异性和灵敏度。另外,不同组成和浓度的样品检测后导致不同的背景信号从而不易进行判断。


Affymetrix的解决方案

    针对以上的影响因素,Affymetrix 采用如下策略以最优化的方式进行基因表达的分析。
    独特的PM-MM探针对设计:设计一对25-mer探针,其中一个是完全匹配(perfect match PM) 及有一错误位点匹配(mismatch MM)探针。该设计可提高探针的灵敏度和特异性,尤其针对在一个复杂背景的样品中低丰度表达产物的检测。Affymetrix的PM-MM探针设计策略有助于区分特异性结合与非特异性结合的靶片段。经过周密细致的试验研究者们发现25-mer是一个理想的探针长度,较那些仅用单一探针的策略来说,PM-MM探针设计使得检测低浓度靶序列的特异性和灵敏度大大提高。因为MM探针可将样品中的背景信号探测出,所以能够区分背景信号的策略对那些相对较弱的阳性信号来说尤为重要。

    如图1所示,将已克隆的转录产物以不同的浓度掺入到组织样品中,在组织样品中是不含有原始的克隆转录产物的。经过标记的样品与Affimatrix Genechip人类基因组芯片杂交,在克隆转录产物浓度低于8mM时,PM单独探针无法探测出相应的浓度变化,而MM探针联合使用则可以探测出,PM-MM探针对的使用可以探测出样品中转录物的范围为1:100,000-1:300,000。PM-MM探针对照设计可提高对复杂背景特异性检测,使得灵敏度她他特异性之间达到一个优化的平衡。

    图1 仅用PM探针与联合应用PM-MM探针检测靶序列的灵敏度比较


PM-MM探针对照设计可提高在复杂背景中检测的特异性,使得灵敏度和特异性之间达到一个优化的平衡。

    MM探针是有效的内参照,因为它们能够象PM探针一样,与非特异性序列结合。同时对那些不同来源的样品中非特异性的背景信号就可以被有效地定量和扣除。

    对两个有同源性的基因序列而言,设计多个短的探针片段,可将这两个基因的差异区分开,例如:用Affimatrix芯片可将酵母的组蛋白基因HTA1及HTA2在DNA水平有93%的同源性区分开(L. Wodicka and D. Lockhart, unpublished data)。

    灵敏度分辨率实验提示:25-mer长的寡核苷酸信号强度和相关序列分辨之间提供了有效的平衡,使得对上千种靶序列的监测成为现实(5)。只有短片段探针(如25个核苷酸)表现得非常有效。由于25个碱基序列中有一个错配将会使得杂交复合物不稳定。如果探针长达60mer,则不能采用此策略,因为要获得同样的分辨率则要求更长的错配开叉或突变(6)。另外,60mer的探针常常无法区分非常接近的两条序列。尤其在转录物表达水平丰富的状况时。

GeneChip®芯片的综合评估方式检测基因表达变化可以最大限度地提高芯片上检测基因的数量

    对某一特殊靶序列而言,通过优化杂交条件可以达到一个很高的分辨率。但对一张基因芯片上的成千上万种探针序列来说,就不能保证该杂交反应条件具有足够的严谨度。Affimatrix不象Hughes等那样利用少部分序列进行杂交检测(6),而是通过对在一张芯片上的所有探针进行测量评估来优化杂交及检测条件。

    Affimatrix芯片采用群体分配的方式进行杂交检测结果的监测。理论上假设认为:完全匹配的序列与PM探针的杂交效果率要高于MM探针,则在芯片上的PM探针位置上的荧光强度要高于MM探针。

    如图2所示,X轴表达分辨率分值log(PM/MM),在最左端的负值表示所有的信号都出现在MM探针位置上;与此相反,在最右端的正值表示所有的信号都出现在PM探针位置上。绿色区域位置上的点代表PM信号=MM信号值的点。在红色区域的点代表的是与真正靶序列结合的探针位点的数量,对杂交条件进行优化过程中,使红色区域尽量大(即最大限度地排除假阳性位点)。
经过系统综合的调试,可以将假阳性率降至最低,将那些真正与探针互的靶序列检测出,而如果仅仅观察有限的几个序列杂交结果是无法像上述那样进行校准数据。

    图2:在一张芯片上的杂交结果进行全面综合分析优化杂交条件


利用多个探针对某一序列可进行基因表达的绝对和相对水平分析,从最小数量样品中获得高质量的有统计学意义的数据

    利用单个探针来检测靶序列无法克服样品中多种具有同源性的靶序列与探针进行交叉杂交反应的问题,从而造成 假阳性和判断错误(5,6)。如果选择单个探针来检测样品中的靶序列,则该选探针须具备以下条件,如:与其它靶序列不交叉杂交,自身不折叠,且与真正靶序列的杂交效率要高。这些要求对单一探针来说,要完全具备往往很难达到。

    为了解决此问题,Affimatrix采用多段25mer的探针针对某序列的特异性部位序列设计多个探针,形成一个探针组来克服背景噪声、错误和偏差。

多个探针进行分析和统计计算可增加数据的可信度,GeneChip®微阵列对基因表达进行绝对值计算以及相对比较分析,所获得的结果有利于构建大数据库

    从多个探针位点检测的荧光信号,经过综合评估、统计计算和分析,获得的数据比单个探针判断样品是否存在某一靶序列的数据更为可靠。

    Affimatrix的基因芯片分析平台不仅可以分析某一样品中基因表达的绝对水平,还可以比较不同样品之间各种基因表达的相对比例,与双色分析法相比,双色法需在每次杂交检测中设置对照,只能进行两个样品之间的比较,而Affimatrix基因芯片分析法可以进行多个样品之间的比较,且只需在多个样品中设置对照即可。

    Ishii等(7)比较了GeneChip®技术和SAGE之后得出结论认为:用这两种方法检测获得的结果符合得很好,无论是用来进行绝对表达水平的检测还是比较样品之间的基因表达水平的检测。因而结果提示Affimatrix基因芯片技术用于进行定量分析基因表达谱是一个可靠的分析平台。

    Aach et al(8)报告了他们试图努力将不同分析方法获得的数据进行整合和系统分析的工作,他们发现:Affymetrix 和SAGE检测获得的数据可直接用于mRNA相对表达水平的估计,而双色法得到的数据尚需进一步的讨论。


结论

    综上所述,Affymetrix 采用独特的PM-MM 探针对设计以获得在一复杂样品背景中检测的高灵敏度和特异性之间的优化平衡。对芯片上所有探针的杂交结果进行综合判断形成一整套数据,可以最大限度地提高在一张芯片上检测基因的数量。对某一基因序列进行冗余取样设计多对探针来检测样品,所获得的数据翔实可靠,与GeneChip®分析平台整合可获得可靠、重复性好的分析结果,从而建立有效的高通量基因表达分析的数据库。


参考文献
1) Cho, R.J. et al., (1998) A Genome-Wide Transcriptional Analysis of the Mitotic Cell Cycle. Molecular Cell, 2:65-73 
2) Golub, T.R. et al., (1999) Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring. Science, 286:531-537 
3) Jin et al., (2001) Effects of Early Angiotensin-Converting Enzyme Inhibition on Cardiac Gene Expression After Acute Myocardial Infarction. Circulation, 103:736-742 
4) Forman, J.E. et al., (1997) Thermodynamics of Duplex Formation and Mismatch Discrimination on Photolithographically Synthesized Oligonucleotide Arrays in Molecular Modeling of Nucleic Acids. (N.B. Leontis and J. Santa Lucia Jr., eds.) American Chemical Society Symposium Series 682:208-228 
5) Lockhart, D.J. et al., (1996) Expression Monitoring by Hybridization to High-Density Oligonucleotide Arrays. Nature Biotechnology, 14:1675-1680 
6) Hughes, T.R. et al., (2001) Expression Profiling Using Microarrays Fabricated by an Ink-Jet Oligonucleotide Synthesizer. Nature Biotechnology, 19: 342-347 
7) Ishii, M. et al., (2000) Direct Comparison of GeneChip and SAGE on the Quantitative Accuracy in Transcript Profiling Analysis. Genomics, 68:136-143 
8) Aach, J. et al., (2000) Systematic Management and Analysis of Yeast Gene Expression Data. Genome Research, 10:431-445


订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号