Nature:中国科学家参与的千人基因组计划

【字体: 时间:2010年10月29日 来源:生物通

编辑推荐:

  昨日出版的Nature杂志的封面是“千人基因组”计划的最新研究成果,这也是这一计划自两年前(2008年)启动后的首次发表的成果,在这一成果中,我们可以看到中国科学家作出的贡献。

  

生物通报道:昨日出版的Nature杂志的封面是“千人基因组”计划的最新研究成果,这也是这一计划自两年前(2008年)启动后的首次发表的成果,在这一成果中,我们可以看到中国科学家作出的贡献。

“千人基因组”计划是2008年初,由来自英国桑格研究所,美国国立人类基因组研究所,中国深圳华大基因研究院等多家机构启动的一项测序计划,在这一计划中,科学家们将对全球各地至少1000个(目前是2000个人左右)人类个体的基因组进行测序,寻找基因与人类疾病间的秘密关系。通过这些测序也将生成一个庞大的、公开的人类基因变异目录,有助于进行分析以及个体化医疗。

而最新发表的这篇文章则是这一计划的首项成果,这一试点阶段的成果通过高通量的分析手段,在高吞吐量平台上进行全基因组测序,包括:对三个人群的179人按低覆盖率进行全基因组测序;对两个由“母亲-父亲-孩子”组成的三人组按高覆盖率进行测序;对来自七个人群的697人进行以外显子为目标的测序。

因此这项计划取得这一重要的成果也要部分归功于现代测序技术的飞速发展,研究人员认为若采用之前的技术,这些工作可能需要花费5亿美元以上,而现在利用高效、更低价的新测序技术,研究人员希望未来成本最终降低至3000万到5000万美元。这篇文章的参与单位中也包含了许多在这一领域占据重要地位的一些厂家,比如Illumina,Life Technologies(原Invitrogen公司),罗氏,Pall公司,以及Agilent公司等。

这项研究找出了1000多万个大大小小的基因变种,其中约800万个都是以前所未知的。对于人群携带率在1%以上的基因变种,本次研究的覆盖率达到95%以上。这一成果在医学等领域有很高的应用价值,比如通过参照图谱,可以方便地找出致病的基因变种。

另外研究人员还验证了在大型基因研究中综合使用多种基因测序手段的可行性。由于基因测序成本目前仍很高昂,如果能在“精测”一些基因序列的同时,对另一些基因序列只需“粗测”就能保证最终结果的准确性,将可以大幅降低基因测序研究的成本。Science相关文章对这一方面进行了介绍,文中提到研究人员开发出了几种分析和计算技术克服了对多拷贝基因进行研究的障碍,利用这一新方法,研究人员对1900个碱基对长的DNA片段拷贝数进行精确估计,拷贝数的计数范围为0-48之间。

在这项成果中,华大基因作为“千人基因组”计划的发起单位之一,不仅承担了400个黄种人全基因组样本的测序和分析工作,还帮助完成了非洲人群的全部测序和分析任务。据报道,“千人基因组计划”中的黄种人基因组研究,将使中国基因组科学和相关医学研究直接跨入与国际前沿完全接轨的世界先进行列,大大促进中国药物基因组学研究的发展。

我国虽然在基因组测序领域起步较晚,但发展迅猛。自1999年作为唯一的一个发展中国家加入人类基因组计划,到目前为止,已经独立完成了水稻和家蚕等大型基因组研究,并参与了家鸡、家猪、木瓜等多个重要动植物基因组图谱制作,在2007年还首次向世界公布了第一个中国人的个体化基因组序列。

(生物通:张迪)

原文摘要:

A map of human genome variation from population-scale sequencing

The 1000 Genomes Project aims to provide a deep characterization of human genome sequence variation as a foundation for investigating the relationship between genotype and phenotype. Here we present results of the pilot phase of the project, designed to develop and compare different strategies for genome-wide sequencing with high-throughput platforms. We undertook three projects: low-coverage whole-genome sequencing of 179 individuals from four populations; high-coverage sequencing of two mother–father–child trios; and exon-targeted sequencing of 697 individuals from seven populations. We describe the location, allele frequency and local haplotype structure of approximately 15 million single nucleotide polymorphisms, 1 million short insertions and deletions, and 20,000 structural variants, most of which were previously undescribed. We show that, because we have catalogued the vast majority of common variation, over 95% of the currently accessible variants found in any individual are present in this data set. On average, each person is found to carry approximately 250 to 300 loss-of-function variants in annotated genes and 50 to 100 variants previously implicated in inherited disorders. We demonstrate how these results can be used to inform association and functional studies. From the two trios, we directly estimate the rate of de novo germline base substitution mutations to be approximately 10−8 per base pair per generation. We explore the data with regard to signatures of natural selection, and identify a marked reduction of genetic variation in the neighbourhood of genes, due to selection at linked sites. These methods and public data will support the next phase of human genetic research.

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号