ABI遗传分析平台助力千人基因组计划[创新技巧]

【字体: 时间:2008年05月06日 来源:生物通

编辑推荐:

  

由美国人类基因组研究院、英国Sanger基因组中心和深圳华大基因研究院发起的一项世界性的研究工作千人基因组计划,将会对来自世界各地的1000个人类基因组样本进行测序,从而构建迄今为止最详细和最有医学价值的人类遗传变异图谱。其中美国Baylor医学院人类基因组测序中心决定购买六台SOLiD系统来完成第一期工作,并将在4个月时间内利用SOLiD系统获得大约2000亿碱基序列数据,相当于全球最大的公共DNA序列数据库GenBank的数据量总和。无可比拟的高通量和可扩展性使得SOLiD系统从其他新一代测序平台中脱颖而出。经过客户端使用证实SOLiD系统每轮运行可产生超过10GB的数据。SOLiD系统帮助研究人员确立测序人类基因组全序列的最佳方式

ABI供稿 生物通翻译

生物通报道:美国Baylor医学院人类基因组测序中心(HGSC)的研究人员将使用ABI公司的高通量测序系统进行千人基因组计划的第一期工作。该项目是由美国人类基因组研究院、英国Sanger基因组中心(Wellcome Trust)和深圳华大基因研究院发起的一项世界性的研究工作,将会对来自世界各地的1000个人类基因组样本进行测序,从而构建迄今为止最详细和最有医学价值的人类遗传变异图谱。Baylor医学院人类基因组测序中心决定购买六台SOLiD系统来完成这项工作。

千人基因组计划产生的数据将有望揭示DNA序列的变异如何导致癌症,糖尿病以及心脏病等疾病发生的线索,HGSC将利用SOLiD系统来帮助研究人员确定测序这1000个人类基因组样本的最佳方法,从而提高HGSC在该项计划第一期工作的贡献。

这项计划的一期工作于本月初开始。在这个项目的一期工作即将完成时,HGSC将在4个月时间内利用SOLiD系统获得大约2000亿碱基序列数据。这些序列数据将包含高序列覆盖率的24个人类基因组样本和一个更高的序列覆盖率的单个人类基因组样本。这四个月获得的数据量相当于全球最大的公共DNA序列数据库GenBank的数据量总和!


在分析人类遗传变异时,覆盖率的深度指利用测序分析平台从基因组样本中所读出的DNA数据相当于30亿碱基对(3GB,大约相当于一个人类基因组样本的平均容量)的倍数。更深度的基因组覆盖率可增加研究人员检测基因组上每个碱基的可靠性。因此研究人员就能够更好地识别基因组中变异的发生频率。据HGSC介绍,千人基因组计划一期工作的目标之一将是确定为全面了解个体间基因组中DNA序列显著差异所需的序列覆盖深度。

HGSC选择使用SOLiD系统进行这项研究的其中一个原因是由于SOLiD极高通量的测序能力,已经证实SOLiD系统每轮运行能产生超过100亿碱基数据(10GB),超过了3倍基因组覆盖率。SOLiD系统的通量使之成为目前最高通量的遗传分析系统。这个超高通量遗传分析系统将帮助HGSC的研究人员以高效和合理成本完成这项研究工作。

“对于阅读片段在25-50碱基之间的测序平台无疑需要对付非常高密度的数据”Baylor医学院HGSC主管Richard Gibbs博士表示,“我们相信SOLiD系统将会成为这个领域的主宰”。研究人员将根据来自多个渠道和测序平台对同一个基因组样本分析所得到并汇合的数据,最后确定千人基因组计划所选择的遗传分析平台。

尽管绝大多数的人类遗传信息在所有人中都相同,但是研究人员通常更感兴趣的是研究个体之间微小的遗传差异。这种差异包括单碱基变异----即单碱基多态性SNP,以及被称为结构变异的各种较大片段DNA序列变异。结构变异包括DNA片段的插入、缺失、倒位和易位,结构变异的DNA片段范围可从几个碱基对到数百万个碱基对,可能对基因产生重要影响,并导致人类疾病的发生。

尽管人类的绝大部分遗传信息是相同的,但是研究人员通常更感兴趣的是研究个体之间微小的遗传差异。这种差异包括单碱基变异----单碱基多态性SNP,以及各种较大片段DNA序列变异----结构变异。在千人基因组计划中,为了高效地确定基因组中的SNP,研究人员必须能够区别真正的遗传变异和测序误差,这就需要一种高度精确的遗传分析系统。兼具覆盖率深度和高精确度的遗传分析系统有助于研究人员鉴别存在于个体间的遗传差异。

采用更高精确度的遗传分析系统可降低准确鉴别基因组样品间差异所要求的测序覆盖率。HGSC决定使用SOLiD系统进行千人基因组计划研究,部分得益于一项对SOLiD系统和其它短阅读平台进行微生物和哺乳动物基因组测序的比较研究之结果。

在描绘人类基因组的过程中,研究人员努力实现精确鉴定和定位基因组中的遗传变异。配对(Mate-Pair,对长片段DNA克隆两端测序可得到位于克隆两端,间距离已知的两个读段,构成一个Mate-Pair)分析,或者说遗传分析系统对间隔一定距离(即插入大小)两端序列的分析,使研究人员得以确定基因组中结构变异的精确位置。结构变异包括基因拷贝数变异,单碱基复制、倒置、易位、插入和缺失。例如,通过分析多达10000碱基对的插入片段,SOLiD系统完全可以对付基因组中跨越大段重复区域的序列。配对(Mate-Pair)分析有助于精确定位重复区域内或附近的读出序列,而这在个体间通常差异很大。SOLiD系统的这种能力有助于研究人员将大量的DNA序列片段精确拼接出整个人类基因组序列。

一旦研究人员确认要准确鉴别人类基因组样本中的SNPs和结构变异所需的测序覆盖率,他们将更充分利用基因组信息。例如研究人员可以更好了理解个体间的遗传差异与个体间对疾病的易感性、以及个体对疾病治疗方案的反应的关系,从而向终极目标个性化医疗迈进。
“HGSC选择添置SOLiD系统进行大型人类再测序计划,进一步证实了SOLiD平台在进行这类研究中的优势。”ABI分子和细胞生物学基因组分析部门负责人Shaf Yousaf 表示,“这个项目的成功完成将会拓宽基因组分析的应用,并为个性化医疗和疾病相关研究开启大门。我们相信这项计划将推动生命科学研究人员向着确定人类遗传变异和疾病之间精确关系前进了一大步。

有关SOLiD系统
SOLiD系统是一个端到端的新一代基因组研究方案,包含测序组件、化学组件、计算集群和数据存储组件。这个平台基于通过寡核苷酸连接和检测进行测序。与聚合酶测序方法不同的是,SOLiD系统利用专利的逐步连接(stepwise ligation)技术来产生高质量的数据,可应用于全基因组测序、染色质免疫共沉淀(ChIP)、微生物测序、数字核型分析、临床测序、基因型分析、基因表达分析和小分子RNA的发现等等。

无可比拟的高通量和可扩展性使得SOLiD系统从其他新一代测序平台中脱颖而出。这个系统可以通过提高上样玻片的磁珠密度,从而扩展支持更高密度测序。微珠是SOLiD系统开放式上样玻片格式的内在组成部分,使得系统每轮运行可以产生高达6Gb的测序数据。经过客户端使用证实SOLiD系统每轮运行客产生超过10GB的数据。开放式上样玻片格式和灵活可变的磁珠密度,再加上软件运算法则,构成系统SOLiD可扩展到更高通量的基础,这种扩展无需显著改变平台现有硬件和软件装备。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号