“千人基因组计划”将绘制最详尽的人类基因图谱

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2008年01月24日 来源：生物通

编辑推荐：

　　1月22日，由中国、英国和美国的科学家组成的“国际协作组”在深圳、伦敦和华盛顿同时宣布国际“千人基因组计划”正式启动。生物通将为您报道这一重大国际合作计划的目标和意义，以及中国在其中发挥的重大作用，并简要回顾人类基因组研究的历史。

　　生物通报道：北京时间2008年1月22日21时整，由中国、英国和美国的科学家组成的“国际协作组”在深圳、伦敦和华盛顿同时宣布国际“千人基因组计划”正式启动。

宏伟的目标

这一计划将测定选自全世界各地的至少一千个人类个体的全基因组DNA序列，绘制迄今为止最详尽的、最有医学应用价值的人类基因组遗传多态性图谱。

“千人基因组计划”的科学目标就是绘制一张几乎覆盖全人类的基因组遗传变异图谱，包括所有在人群中的出现频率不低于1%的变异，以及基因之内的、出现频率小于0.5%的变异。基于这样的目标，初步估计需要测定1,000个以上的个体的全基因组序列。接受测试的人将是匿名的，也不披露他们的医学信息，因为“千人基因组计划”提供的将是人类遗传变异的基础信息。未来，研究人员可以利用该图谱研究某种疾病的患者。

该项目的负责人之一，英国Sanger研究所的RichardDurbin博士说：“‘千人基因组计划’将在前所未有的水平上对人类基因组进行详尽的研究。这一计划即使在两年之前还不敢设想，现在，由于测序技术、生物信息学和群体基因组学取得的重大突破，我们已经非常有把握能够成功。因此，我们正乘胜追击，从横向和纵深两方面加速发现更多的与人类健康和疾病相关的遗传因素。

这一计划将采用几种新的高通量测序平台。若使用目前标准的DNA测序技术，同样的工作可能需要花费5亿美元以上。然而，由于该计划的创造性的努力，建立了更高效更低价的新测序技术，“千人基因组计划“的发起者希望这一计划的成本最终将降低至3000万到5000万美元。

跨国界的合作

这一国际合作计划的主要发起者和承担者包括英国的桑格研究所，中国的深圳华大基因研究院（BGIShenzhen），以及美国的国立卫生研究院（NIH）下属的美国人类基因组研究所（NHGRI）。

测试工作将在华大基因研究院、桑格研究所和NHGRI研究所的大规模测序研究网络（包括MIT和哈佛的博大研究院、华盛顿大学的基因组测序中心、贝勒医学院人类基因组测序中心）进行。随着计划的进行，可能还会有其它成员加入。

测序的对象

“千人基因组计划”将测序的人群包括：尼日利亚伊巴丹区域的Yoruba人；居住于东京的日本人；居住于北京的中国人；美国犹他州的北欧和西欧人后裔；肯尼亚Webuye的Luhya人和Kinyawa的Maasai人；意大利的Toscani居民；居住于休斯顿的Gujarati印第安人；居住于丹佛的中国人；居住于洛杉矶的墨西哥人后裔；居住于美国西南部的非洲人后裔。

“千人基因组计划”使用的样品将取自自愿捐献者，他们都签署了捐献DNA以供分析和在公共数据库公布的知情同意书。美国人类基因组研究所和合作者将遵循被全面和认真监管的伦理学程序。同先前的“国际单体型图计划”和国际“人类基因组计划”一样，“千人基因组计划”也将成立专家工作小组，专门监管和该计划相关的伦理、法律和社会问题。

“千人基因组计划”采用的首批1000份样品由两部分组成：“国际单体型图计划”使用的相同样品以及采用同样的程序采集的后续样品。自愿捐献者的健康和个人身份信息没有公开，其样品仅仅标记了所属种群的信息。实际采集的样品数要比实际需要的样品多得多，进一步保证了捐献者信息的匿名性。“千人基因组计划”要收集的更多的样品，也将采用同样的程序。

海量数据将免费共享

由多个学科专家组成的研究团队将共同努力，在完成“千人基因组计划”时将绘制一张与生物医学相关的人类遗传多态性的崭新图谱，其分辨率之高乃现有技术远不能及。与国际“人类基因组计划”和其它重要计划一样，“千人基因组计划”产生的数据和研究成果将迅速通过公共数据库发布，供全球科学家免费共享。

在为期两年的数据产出阶段，该计划将平均每天测序82亿个碱基，相当于24小时内完成2个人的全基因组序列。如此海量的数据以及对该数据的分析，对生物信息学和统计遗传学领域的领军专家将是极大的挑战。

“该计划对人类基因组的研究将达到绝无仅有的精细程度。这一计划将产生6万亿个碱基，它在三年内产生的数据量，将是目前公共数据库中25年内所有数据总和的60倍。”千人基因组计划“数据分析组的首席科学家人之一，牛津大学的GilMcVean博士说：“事实上，当全速运行的时候，该计划在两天内产生的数据量就将相当于当前公共数据库中这么多年来所有数据的总和。”

“千人基因组计划”产生的数据，将由欧洲生物信息学中心（EBI），从属于NIH的美国国家生物技术信息中心（NCBI）及深圳华大基因研究院对镜像站点共同管理和发布。除了变异图谱外，数据库还将包含对这些变异的各类遗传学和医学相关信息，以加速识别最为重要的变异位点。

为什么要启动该计划

任何两个人在基因水平上99%都是一样的，只有小部分的基因组序列因人而异。了解这些差异是非常重要的，它能帮助我们了解人与人之间对疾病的易感性、对药物和环境因素的反应性的不同。人类基因组中的相邻变异组成了一个又一个个完整的信息块，称之为单体型，通常是以一段连续的DNA序列遗传。

目前的人类遗传变异数据，如人类基因组单体型图（HapMap），已被证实对人类遗传研究很有价值。运用单体型图和相关数据，科学家已经发现了100多个与人类常见疾病相关的基因组区域。这些常见疾病包括糖尿病、冠心病、前列腺及乳腺癌、风湿性关节炎、肠炎，以及与年龄相关的黄斑退变等。

然而，由于现有的图谱还不够详细，研究者经常需要通过既昂贵又费时的DNA测序来进一步精确地找到致病基因及其变异。新图谱能让研究者更快地锁定与疾病相关的基因变异点，从而能够使用遗传信息更快地开发常见疾病的诊断、治疗和预防的新策略。

新图谱的用途

美国国立人类基因组研究所（NHGRI）所长FrancisCollins博士说：“这个新计划将把我们发现疾病相关变异的灵敏度在基因组水平上提高5倍，同时基因区内的灵敏度将提高10倍以上。我们现有的数据库已很不错，涵盖了在人群中出现频率10%以上的多态性位点。借助高通量的新测序技术和新开发的计算方法，我们希望为生物医学研究者提供覆盖整个基因组的出现频率为1％的变异。这将彻底改变我们的疾病研究。”
用现有的方法，研究者可以研究与疾病相关的两种遗传变异。第一种是非常罕见，但后果严重的变异，如造成囊肿纤维化和亨廷顿（Huntington）舞蹈症的遗传变异。为了找到这些出现频率低于千分之一的变异位点，研究者通常必须花数年时间来研究这些疾病的家系。另外一类，即大多数的常见疾病，如糖尿病和心脏病，是受一些较为常见的变异影响的。大部分常见变异只产生微小的影响，例如使患病风险增加25％或者更少。目前，通过一种新的叫做“全基因组关联研究”的方法，研究者已能够找到这些常见的变异。

这一计划，同时也是单体型图计划的另一位负责人，美国波士顿的麻省总医院和哈佛－麻省理工学院的Broad研究所的DavidAltshuler博士说，“我们对这两种类型的变异，即罕见和常见的变异之间还存在一个巨大的认识上的‘空白’，而“千人基因组计划”正是为了填补这个‘空白’而设计的。我们预测这个‘空白’中会有很多重要的与人类疾病和健康相关的变异。”

这一新图谱的用途之一将是进一步优化“全基因组关联研究”。研究者如果发现某个基因组区域与某种疾病相关联，将参阅新的图谱，就可以在这个基因组区域里找到几乎所有的变异，进行后续的功能研究，来确定这些变异中哪些是直接致病的。“千人基因组计划”是建立在由“国际单体型图计划”绘制的“人类单体型图”的基础上的。新图谱将为单体型图中的变异提供周边的基因组信息，为研究者提供重要线索来确定哪些变异可能是致病的，并搜寻致病因子的更精确的基因组信息。

相对于单体型图的一个显著进步是“千人基因组计划”不仅会发现人类基因组中单个碱基的差异（即单核苷酸多态性，SNP），同时还会得到高分辨率的基因组结构变异的图谱。这些基因组结构变异包括染色体重排、缺失和区段重复。在过去的18个月中完成的研究已经清楚地表明，这些基因组结构变异是决定某些疾病（如智力迟钝和自闭症）易感性的主要因子。

“千人基因组计划”不仅将加速人们对常见疾病易感性相关的变异的发现，还将加深人们对自身基因组结构变异的认识，同时也开启了医学和生物学中其他新的重大发现的探索之门。

第一阶段分三步走

“千人基因组计划“的第一阶段，将耗时约一年，进行三项先遣实验项目。这些项目的结果将用于决定如何最高效且低成本地绘制这张人类遗传差异图谱。

第一项先导实验项目将包括两个核心家庭（双亲与一个成年子女）的全基因组深度测序，每个基因组的平均测序深度为20倍，即反复测定20次。这六个个体所产生的全面详尽的数据集，有助于确定这一计划如何使用新的测序平台识别遗传变异。这一项目建立的方法将作为整个计划中其它项目进行比较的基础。
第二项先遣实验项目将对180个个体进行浅度测序，每个基因组的平均深度为两倍。这将用于测试新测序技术的浅度测序数据用于检测和定位序列变异的能力。

第三项先遣实验项目将测定1000人的1000个编码区域（也叫外显子）的序列。其目的是探索如何更好地得到约占基因组2％的蛋白质编码基因的更详细的图谱。

人类基因组计划的延续和发展

“千人基因组计划”，是举世闻名的人类基因组计划的延续和发展，是基因组科学研究向临床医学迈进的重要转折点。人类遗传变异的详细图谱将被众多研究者用于寻找和特定疾病相关的遗传变异的研究。这些研究人员将奠定个体化医学和个体基因组时代的基础。到那时每个人测序自己的基因组将成为常规，以预测患上各种疾病的风险和对药物的反应性以针对性地指导用药，最终到人人拥有自己的基因组图谱已经不再是遥不可及的梦想了。

该计划的组织实施是新一代测序技术产业化应用的重大突破，是基因组研究向个体化医疗迈进的重要标志，将为科学界提供最详尽的数字化资源和有力的研究工具，为个体化的预测、预警及诊断和治疗提供必要的基础数据，标志着常见疾病的研究将从局部的模拟信号研究进入到全景式的数字化基因组序列时代，并为解决基因组医学研究相关的伦理、法律和社会问题带来可能。

深圳华大基因研究院副院长王俊博士说：“该计划将推动基因组信息用于医学研究的进程，可以让人们更加了解常见疾病。‘千人基因组计划’向全世界研究者提供的重要数据资源将使所有的国家都受益。”

中国的贡献

华大基因之前还与国家有关机构共同参与了国际“人类基因组计划”和“人类单体型图计划”。在共同发起和参与国际“千人基因组计划”的同时，深圳华大基因研究院还在中国国内启动了“炎黄计划”，在更大的范围研究中国人群的遗传变异，绘制高分辨率的中国人遗传变异图谱。日前已完成并发布了第一个中国人的高质量基因组图谱——“炎黄一号”，近时已经启动了第二阶段的“炎黄99”计划，将对99个中国人个体进行基因组测序及多态性比较。深圳华大基因研究院参与“千人基因组计划”所完成的中国人样品的测序将作为“炎黄计划”的一部分。

中国由9年前参与人类基因组计划并承担其中的1%工作，到今天参与发起千人基因组计划并承担其中的黄种人部分，标志着中国基因组科学实现了由参与到引领的跨越发展。深圳华大基因研究院将是这一工作的主承担单位，其合作单位有生物信息系统国家工程研究中心，中国科学院北京基因组研究所。

“千人基因组计划”中的黄种人基因组研究，将使我国基因组科学和相关医学研究直接跨入与国际前沿完全接轨的世界先进行列，极大地促进我国药物基因组学研究的发展，对以国际接轨和跨越式发展为目标的国家重大新药创制重大专项具有积极的支撑和推动作用。该计划的研究成果必将对中国的医学科学发展和个体化医学实践产生深远的历史性影响；其先进的技术将迅速转化为中国临床医学实践服务的实用技术；科学和技术的双重突破必然催生新的产业发展。

深圳华大基因研究院从2007年10月公布“炎黄一号”完成，到2008年初宣布“全球第一个志愿者基因组测序启动”，发起并参与“国际千人基因组计划”，国内和国际的主要媒体都给与了大量的报道。特别是英国《自然》杂志两篇相关的跟踪专题报道，对深圳和华大、对中国的基因组科学发展给与了高度的正面评价，也引发了国际主要媒体的广泛关注。这在中国生命科学史上还是第一次。深圳市人民政府对这一工作高度重视，全力支持，开创了地方政府主动承担国家重大战略性基础研究的先河，这在中国科技史上也是第一次。

回顾：人类基因组研究的简史

1859年：达尔文发表《物种起源》，提出进化论
1865年：孟德尔发现豌豆的性状分离
1869年：米歇尔首次分离出DNA
1879年：弗莱明观察到有丝分裂
1900年：狄夫瑞斯、科伦斯和切尔迈克分别独立重新发现孟德尔的伟大成就
1902年：加洛德观察到尿黑酸尿症的遗传符合孟德尔法则
1902年：萨顿提出染色体遗传学说
1909年：约翰森创造“基因（gene）”这个单词，用来描述孟德尔的遗传单位
1911年：摩尔根通过果蝇实验提出染色体学说
1941年：比德尔和塔特姆提出一基因一酶假说
1943年：阿斯特伯里获得DNA的X-射线衍射谱
1944年：阿佛雷、马克聊德、马克卡发现遗传物质是DNA
1944年：麦克林托克发现转座子
1952年；赫尔希和助手蔡斯证明遗传物质是DNA
1953年：克里克和沃森发现DNA双螺旋结构
1955年：蒋有兴发现人体细胞中染色体数为46条
1955年：科恩伯格分离出DNA聚合酶
1956年：英格拉姆发现血红蛋白中一个氨基酸的改变将导致贫血
1958年：曼塞尔森和史塔尔证明DNA以半保留的方式复制
1959年：李居讷发现21号染色体异常导致疾病发生
1961年：布伦纳、雅各布和梅索森发现mRNA的信使作用
1966年：霍拉纳、尼伦伯格和奥乔亚阐明遗传密码
1968年：发现DNA限制性内切酶
1971年：伯格创造出第一个重组DNA分子
1973年：从非洲爪蟾中克隆到第一个动物基因
1975年：吉尔伯特、麦克撒穆和桑格发明DNA测序方法
1977年：罗伯茨和夏普发现内含子
1982年：第一个转基因小鼠和果蝇出现
1982年：基因数据库（GenBank）创立
1983年：对亨廷顿慢性舞蹈病进行遗传作图
1983年：发明PCR
1987年：基于限制性片段长度多态性绘制出第一张人类遗传图谱
1987年：发展出酵母菌人工合成染色体（YAC）系统
1989年：发现出微卫星标记
1989年：发现序列标记位点
1990年：国际人类基因组计划启动
1990年：美国国家卫生研究院与能源部成立伦理、法律与社会涵意工作小组
1990年：开始研究细菌人工染色体（BAC）
1991年：表达序列标签（EST）出现
1992年：法国绘制出基于微卫星标记的人类遗传图谱
1993年：新的5年人类基因组计划启动
1994年：第一个转基因食品（莎弗蕃茄）上市
1994年：微生物基因组计划启动
1995年：完成流感嗜血杆菌生殖道支原体两个微生物的基因组测序
1996年：召开第一次人类基因组测序的国际战略会议
1996年：完成小鼠的遗传图谱
1996年：完成酵母的全基因组测序
1996年：完成詹氏甲烷球菌的全基因组测序
1996年：绘制出基于ESTs的人类基因图谱
1996年：人类基因组DNA测序开始
1997年：完成大肠杆菌全基因组测序
1998年：Celera宣布人类基因组测序计划
1998年：结核分枝杆菌全基因组测序完成
1998年：人类基因组计划公布包含30,000个基因的人类基因组
1998年：线虫基因组全序列测序完成
1999年：完成22号染色体的测序
2000年：完成21号染色体的测序
2000年：完成果蝇和拟南芥的基因组测序
2000年：公布酵母的相互作用组
2000年：宣布首次绘成人类基因组“工作框架图”
2001年：公布人类基因组序列第一个草图
2001年：发现RNAi
2002年：水稻基因组测序完成
2002年：小鼠基因组测序完成
2002年：国际人类基因组单体型图计划启动BR>2003年：人类基因组序列图绘制成功，人类基因组计划全部完成
2004年：人类基因组完成图公布
2004年：小鼠和鸡的基因组序列测定
2005年：黑猩猩基因组测序完成
2005年：国际人类基因组单体型图计划完成
2006年：人类X染色体测序工作基本完成
2006年：锥虫基因组测序完成
2006年：狗基因组测序完成
2007年：世界首份个人（DNA双螺旋发现人之一沃森）的基因组图谱诞生

联系信箱：

粤ICP备09063491号

热点排行