《自然》两篇文章公布基因组重大发现

【字体: 时间:2008年02月22日 来源:生物通

编辑推荐:

  基因组一般指单倍体细胞中的全套染色体,或者单倍体细胞中的全部基因,有关基因组的研究一直以来都是科学家们关注的焦点,在最新一期(2月21日)《Nature》杂志上,来自美国康奈尔大学,以及密西根大学的两组研究人员(其中也包括了中国研究人员)在这一方面获得了重要进展,并且这两项研究成果形成对比,证明对人类种群在整个基因组范围内的变化模式进行分析可以为世界范围内的人类迁移和适应模式提供遗传证据。

  

生物通报道:基因组一般指单倍体细胞中的全套染色体,或者单倍体细胞中的全部基因,有关基因组的研究一直以来都是科学家们关注的焦点,在最新一期(2月21日)《Nature》杂志上,来自美国康奈尔大学,以及密西根大学的两组研究人员(其中也包括了中国研究人员)在这一方面获得了重要进展,并且这两项研究成果形成对比,证明对人类种群在整个基因组范围内的变化模式进行分析可以为世界范围内的人类迁移和适应模式提供遗传证据。

在第一篇文章中,来自康奈尔大学分子生物学与遗传学系,德国马普发育生物学研究所(Max Planck Institute for Developmental Biology,生物通注),芝加哥大学,布莱根妇女医院(Brigham and Women's Hospital)等处的研究人员对源自15个非洲裔美国人和20个欧洲裔美国人的11,000个基因进行比对分析,发现有欧洲背景的人与有非洲背景的人相比,其基因组中有潜在危害性的突变更多。这个现象可以被理解为伴随人类在欧洲定居而出现的“走出非洲”瓶颈事件所留下的一个遗传烙印。

计算机模拟显示第一代欧洲人种群具有更小和更少的差别,从而导致野生有害遗传变异在这些种群中更易出现,康奈尔大学分子生物学与遗传学教授,同时为生物系统学与计算机生物学副教授的Carlos Bustamante表示,“我们也许看到的是欧洲一种‘population genetic echo’”。

“由于我们将欧洲群体看成一个大型的群体,因此没有预料到在这两个种群中发现中性突变(neutral variation,生物通注)和有害突变的分布具有如此大的差异”,Bustamante说,“这是令人非常惊讶的,但是当我们将这些结果与其他团队获得数据进行对比,发现了相同的倾向。”

在这项研究中,研究人员主要集中在单核苷酸多态性(single nucleotide polymorphisms,SNPs)相关分析上——SNPs主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,它是人类可遗传的变异中最常见的一种。SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。

研究人员分析了这些变异导致的氨基酸的变化,并利用一种计算机运算法则预测了这些改变是否会引起蛋白功能结构的变化,从而将这些变化归为三类:有益的,可能有害的,以及极有可能有害的。

利用这些信息他们发现欧洲种群的样品,虽然总体而言具有较少的遗传突变,但是相对而言氨基酸改变以及有害氨基酸单核苷酸多肽性比非洲样品的多。下一步研究人员希望能分析除了非洲样品,其它地理位置种群中是否具有相似的序列信号。

在第二篇文章中,来自密歇根大学计算机医学与生物学中心,美国国立健康研究院NIH,台湾长庚纪念医院(Chang Gung Memorial Hospital,生物通注)等处的研究人员通过分析在“人类基因组多样化项目”中所涉及的29个种群,获得了人类基因组中超过500,000多个DNA标记。这些数据表明,与非洲的地理距离越远,连锁不平衡(linkage disequilibrium)越大。

研究人员对485个人的DNA进行了研究,分析这些人的三种遗传多态性,单核苷酸多态性SNPs、单倍型(haplotypes)多态性和拷贝数多态性(copy-number variant, CNV)——如果说基因组是一本包含30亿个字母的生命之书,那么单核苷酸多态性就是其中单个字母的变化,单倍型多态性代表着一个单词改变,而拷贝数多态性则是一整页的重复或脱落。

这项研究获得的数据与之前对人类群体进行世界性的研究对比详细100倍,并且也证实了100,000年前,人类从东非向东迁徙的过程中,连绵不断的迁移每一次都带走前一个人群的遗传多态性子集。这样在迁徙的过程中遗传多样性就不断丢失。
(生物通:张迪)

原文摘要:
Nature 451, 994-997 (21 February 2008) |
doi:10.1038/nature06611; Received 26 October 2007; Accepted 17 December 2007
Proportionally more deleterious genetic variation in European than in African populations
Abstract

Nature 451, 998-1003 (21 February 2008) |
doi:10.1038/nature06742; Received 2 December 2007; Accepted 29 January 2008
Genotype, haplotype and copy-number variation in worldwide human populations
Abstract

名词解释:

1.基因组(Genome)

一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。可是基因组测序的结果发现基因编码序列只占整个基因组序列的很小一部分。因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。说的更确切些,核基因组是单倍体细胞核内的全部 DNA分子;线粒体基因组则是一个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。

2.人类基因组计划

人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与了这一价值达30亿美元的人类基因组计划。这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。

1986年,诺贝尔奖获得者Renato Dulbecco发表短文《肿瘤研究的转折点:人类基因组测序》(Science, 231: 1055-1056)。文中指出:如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。…… 从哪个物种着手努力?如果我们想理解人类肿瘤,那就应从人类开始。……人类肿瘤研究将因对DNA的详细知识而得到巨大推动。”

什么是基因组(Genome)?基因组就是一个物种中所有基因的整体组成。人类基因组有两层意义:遗传信息和遗传物质。要揭开生命的奥秘,就需要从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。 为什么选择人类的基因组进行研究?因为人类是在“进化”历程上最高级的生物,对它的研究有助于认识自身、掌握生老病死规律、疾病的诊断和治疗、了解生命的起源。

在人类基因组计划中,还包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。 HGP的目的是解码生命、了解生命的起源、了解生命体生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。

3.中性突变(neutral mutation)

指在自然选择上既无益也无害的一类突变,一般认为中性突变在分子水平上的进化方面起着重要的作用。

4.单核苷酸多态性(single nucleotide polymorphism,SNP)

单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。

SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。

理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的SNP都是二等位多态性的。这种变异可能是转换(C T,在其互补链上则为G A),也可能是颠换(C A,G T,C G,A T)。转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。Wang等的研究也证明了这一点。转换的几率之所以高,可能是因为CpG二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。

在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的SNP(coding SNP,cSNP)比较少,因为在外显子内,其变异率仅及周围序列的1/5。但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。

从对生物的遗传性状的影响上来看,cSNP又可分为2种:一种是同义cSNP(synonymous cSNP),即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义cSNP(non-synonymous cSNP),指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。cSNP中约有一半为非同义cSNP。

先形成的SNP在人群中常有更高的频率,后形成的SNP所占的比率较低。各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相同,但大约有85%应是共通的。
 

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号