高通量的SNP基因分型[选购宝典]

【字体: 时间:2008年12月05日 来源:生物通

编辑推荐:

  人类基因组中有30亿个碱基对,每一对都可能蕴藏着精彩的故事。如果你想要寻找肺癌的易感基因,怎么找?只能广撒网,钓大鱼。将病人与正常人的序列进行比较,从而找出那些可疑的分子。这些分子,或者说是标记,就是单核苷酸多态性(SNP)。SNP几乎遍布整个人类基因组,平均1000个碱基对就有1个SNP,总数可达300万个。这么多个SNP,如果挨个来找,干完估计也快退休了。于是,高通量的SNP基因分型也就有了广阔的市场。

人类基因组中有30亿个碱基对,每一对都可能蕴藏着精彩的故事。如果你想要寻找肺癌的易感基因,怎么找?只能广撒网,钓大鱼。将病人与正常人的序列进行比较,从而找出那些可疑的分子。这些分子,或者说是标记,就是单核苷酸多态性(SNP)。人类全基因组计划完成之后,全球多个国家合作(加拿大、中国、英国,日本等)启动了一项后续计划——人类基因组单体型图计划(简称HapMap计划)。该计划的目的就是研究SNP位点和疾病的关系,旨在建立一个帮助研究者发现人类疾病及其对药物反应差异的相关基因公用数据库。

SNP是指基因组内特定位置上存在两种不同的核苷酸,其中最少一种在群体中的出现频率不低于1%(低于1%就算点突变了)。SNP几乎遍布整个人类基因组,平均1000个碱基对就有1个SNP,总数可达300万个。这么多个SNP,如果挨个来找,干完估计也快退休了。因此,高通量的SNP基因分型也就有了广阔的市场。

SNP和CNV的全基因组关联研究数据分析培训班>> >>

各大厂家不断修订基因分型的方法,来满足更高的通量需求,并容纳每一个SNP密度。尽管这些方法原理不同,所需仪器各异,价格也相去甚远,但是条条大路通罗马,我们最终都能实现SNP基因分型。

说起高通量,大家立马会想到芯片。一张芯片上包含了数十万甚至上百万个探针,效率立即提高百万倍,真爽。比如Illumina和Affymetrix,每一个芯片点对应着基因组上的特定变异。Roche Nimblegen也提供了几款基于芯片的基因分型产品,不过它着重于检测拷贝数变异(copy-number variant,CNV)。

Illumina公司的Infinium全基因组SNP芯片包括4种产品:Human1M-Duo、Human660W-Quad、HumanCytoSNP-12、和HumanExon510S-Duo。它们分别包含了1.1M、658K、300K和510K个标签SNP。产品名称的最后一个单词或数字代表了样品数量,Duo代表2,Quad代表4,12自然就代表12个样品。

Infinium 全基因组SNP芯片采取了标签SNP(tag SNP)的策略。什么是标签SNP?一个染色体区域可以有很多SNP位点,能代表其他位点信息的SNP位点就称为标签SNP;用少数几个标签SNPs,就能够提供该区域内大多数的遗传多态模式。利用标签SNP可极大提高关联分析的有效性。Infinium芯片采用标签SNP的策略,相比随机选择SNP位点的策略,可以通过更少的SNP位点达到更强的统计学效果。

Human1M-duo芯片包含了超过110万个标签SNP,平均间隔为1.5kb。一张芯片上可以容纳两个样品,那么一次就能分析230多万个位点。平均检出率和重复性超过99%。最新推出的HumanCytoSNP-12芯片是第一个能同时检测12个样品的SNP芯片,这样一张芯片上就拥有了超过360万个遗传标记。配合这个芯片的上市,Illumina同时推出了一款专门的细胞遗传学软件包,名为KaryoStudio。新的软件满足了研究人员简单易用、自动化分析的需求。它还能与细胞遗传数据库连接产生简单的报告,以及与已知表型交叉匹配的结果。这样,你就真正拥有了一套低成本、高通量的整合工具,来进行细胞遗传学的研究。

全基因组SNP Array 6.0是Affymetrix公司最新一代SNP芯片,在一张芯片上可以分析一个样品906,600个SNP的基因型。其中482,000个SNPs来自于前代产品500K和SNP5.0芯片,而其余424,000个SNP则包括了来源于国际HapMap计划中的标签SNPs,X、Y染色体和线粒体上更具代表性的SNPs,以及来自重组热点区域和500K芯片设计完成后新加入dbSNP数据库的SNP。该芯片同时含946,000个CNV探针。SNP和CNV两种探针高密度且均匀地分布在整个基因组,作为拷贝数变异和杂合性缺失(LOH)检测的工具来发现微小的染色体增加和缺失。

如果你觉得上述现成的芯片不大合用,当然也可以定制芯片。Illumina公司的GoldenGate技术就为你提供了这样的平台。HapMap计划中有70%的数据就是在Illumina公司GoldenGate这个专利技术平台上产生的。其中中国科学家承担了共10%的工作,而这之间95%的工作都是在国家人类基因组南方研究中心的Illumina GoldenGate技术平台上完成的。

GoldenGate的基本原理如下图。它包含了三条引物,一条引物是分析的条形码,而另两个引物区分SNP。首先,基因组DNA与三条引物、DNA聚合酶、连接酶共同孵育,进行引物延伸反应,得到PCR反应的模板。PCR产物随后用荧光标记的等位基因特异的引物进行扩增,与固相载体上的磁珠进行杂交,并读出结果。每个样品可同时检测96个或384-1536个SNP位点。

飞行时间质谱(MALDI-TOF)也是高通量SNP检测的好选择。Sequenom公司的飞行时间质谱系统曾被评为全球最佳技术平台。它的原理是:首先通过PCR扩增含有SNP的基因组片段,然后通过序列特异性引物实现单碱基延伸,随后样品分析物与芯片基质共结晶后在真空管中受瞬时纳秒 (10-9s) 强激光激发。核酸分子因此解吸附成为单电荷离子,由于电场中离子飞行时间与离子质量成反比,通过检测核酸分子在真空管中的飞行时间而获得样品分析物的精确分子量,从而检测出SNP位点信息。正因为它是靠分子量而不是颜色来检测SNP,因此准确性非常高。另外,飞行时间质谱的检测通量大、周期短、灵活性强,而最具有吸引力的应该还是它的性价比。目前华大基因推出的飞行时间质谱SNP基因分型检测服务,每个基因型只需要5元。

假如上述的通量都不能满足你的要求,项目需要或老板逼迫你每天检测1000个样品,怎么办?听了我的介绍,保证你不用去撞墙。ABI公司最新推出了更高通量的TaqMan OpenArray基因分型系统,可在一天时间内对1500多个样品进行验证或筛选。

TaqMan OpenArray基因分型系统包含了两种世界一流的技术:TaqMan基因分型分析和OpenArray技术。TaqMan基因分型分析利用两个等位基因特异的MBG探针和两个PCR引物,能提供高度可靠和准确的基因分型检出。OpenArray技术则使用纳升射流技术平台,进行小体积的大规模并行分析。OpenArray技术中的平板有如显微镜载玻片大小,上面有3072个通孔,以48个子阵,每个子阵64通孔的形式排列。TaqMan 基因分型分析(最多256个SNP)以脱水的形式预装在平板上。至于哪个孔中装哪种分析试剂,这都由你说了算。一旦到货,只需将你的样品和TaqMan OpenArray Master Mix简单混合,加到基因分型平板中,密封,扩增并成像,就OK了。这么简单的流程,难怪不需要机器人的协助,一天也能搞定1500多个样品中。

这么高度的自动化,当然需要仪器的协助。要想省事,就得花钱,空手套白狼这样的美事可不多见。TaqMan OpenArray基因分型的仪器平台包括了进行成像和数据分析的OpenArray NT成像仪、OpenArray自动上样器、OpenArray封箱工作站以及计算机、显示器和软件。PCR仪当然也需要,不过估计大家都有了。

总的来说,TaqMan OpenArray基因分型系统为高通量的基因分型应用提供了不太昂贵的全系统解决方案。这项综合技术所需试剂量的减少(33nL),大大降低了每个基因分型的价格,相同的经费能得到更多结果。另外,产品标价透明,无额外的合成费用或其他任何隐性费用。

此外,新一代测序技术也为高通量SNP基因分型另辟蹊径。无需设计探针或者引物,直接把序列测出来,比较,就完事。这对以前的自动测序仪来说可能不太现实,但新一代测序仪比如SOLiD系统单次运行就能得到20GB可作图的数据,相当于人类基因组的7倍,同时准确率超高。那么在此基础上完成SNP基因分型也不是一件困难的事情。麻省理工和哈佛大学Broad研究院的研究人员正使用SOLiD系统来大规模探索人类基因组样品中的遗传变异。这项研究将成为Broad研究院对千人基因组计划贡献的一部分。千人基因组计划产生的数据将有助于揭示DNA序列如何变异会导致癌症、糖尿病及心脏病等情况发生。Broad研究院的Chad Nusbaum博士将应用SOLiD系统得到的SNP结果与已知的SNP数据库进行比较,发现完全一致,SNP分型结果非常准确。

现在,有这么多好的工具和试剂在手,讲述人类基因组的故事应该会变得越来越简单。

(生物通 余亮)

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号