85后学科负责人 李英睿 勇闯基因组学高峰

【字体: 时间:2009年12月25日 来源:生物通

编辑推荐:

  编者按,当我看到李英睿的简历时,不禁被他华丽的学术经历所震撼,一个85后的大男孩,与华大基因研究院结下了深厚的渊源,从大二开始实习,到1年后成长为学科带头人,08年毕业后,工作仅1年,担任华大科学体系第一负责人。当然,站在华大基因研究院的高地上,仅仅2008年-2009年2年时间,他交出的论文成绩也十分的华丽,1篇《Nature》,3篇Nature系列文章,1篇《Science》,共11篇国际权威期刊论文,其中4篇为第一作者。

  

编者按,当我看到李英睿的简历时,不禁被他华丽的学术经历所震撼,一个85后的大男孩,与华大基因研究院结下了深厚的渊源,从大二开始实习,到1年后成长为学科带头人,08年毕业后,工作仅1年,担任华大科学体系第一负责人。当然,站在华大基因研究院的高地上,仅仅2008-20092年时间,他交出的论文成绩也十分的华丽,1篇《Nature》,3Nature系列文章,1篇《Science》,共11篇国际权威期刊论文,其中4篇为第一作者。

 

2008年发表的Nature封面文章“炎黄一号”基因组成果里有他的一份功劳,也因此,他成为国内屈指可数的在《Nature》上以第一作者身份发表论文的本科生之一。

 

其后,他又参与了多个基因组研究,2009年,他再次以第一作者的身份在《Nature Biotechnology》发表文章,首次提出“人类泛基因组”概念。

 

李英睿,现任深圳华大基因研究院科学体系第一负责人

 

2008 年毕业于北京大学,获北京大学生物科学学士。(2006年)大二暑假就开始在华大进行项目的实战训练,1年之后迅速成长为学科带头人。2007 ~2008年,作为炎黄一号生物信息分析主要负责人之一,其研究成果“第一个亚洲人的基因组图谱”发表在国际著名杂志《Nature》上,成为国内极少数在《Nature》上以第一作者发表文章的本科生之一。其后,李英睿带领团队负责一系列华大基因重大项目的攻坚,包括基因组多态性识别软件的开发,国际千人基因组计划,中丹糖尿病研究计划,全基因组外显子组测序数据分析方法学的建立,炎黄99等。上述研究成果已经发表或者陆续投稿《Nature Science》等国际杂志。如今,李英睿作为华大基因的科学体系负责人,带领团队在复杂疾病、癌症、分子育种、进化等多领域开展基于基因组学技术的研究工作。

 图:李英睿 

 

“人类泛基因组”概念的提出

该研究成果是全球第一个通过新全基因组组装方法对多个人类个体基因组进行拼接,对人类参考基因组序列进行补充,指出了人类基因组中存在“有或无”型的基因变异,从而首次提出了“人类泛基因组”的概念。

 

“人类泛基因组”概念是如何提出的,提出的过程华大研究团队遭遇了哪些困难,请随我,走近该文章的第一作者之一,李英睿。

 

生物通:.泛基因组是你们的研究团队首次提出的吗?当时是什么样的灵感激发你们去构建泛基因组?你们的研究小组可谓在泛基因组领域领先一步,请问国外的科学家怎么没有这方面的研究?

 

李英睿:人类泛基因组,定义为人类基因组序列的非冗余总和,是深圳华大基因研究院首次在国际顶尖杂志上做出系统的表述和分析。泛基因组这个概念最早实际上是在微生物基因组研究中提出来的。由于微生物基因组的高度变异性,单个菌株的基因组序列很难代表整个物种的全部遗传信息,从而缺少合适的参考基因组用于完备的比较基因组学分析,因此需要用泛基因组的概念来概括遗传信息的总集。

 

多数科研工作者之前并未考虑到在人类基因组中也能存在如此巨大的"全或无"序列差异;即使一些研究结果已经表明人类基因组计划所完成的参考序列有潜在不足,一些大的国际协作组(如Genome Reference Consortium)也一直致力于备选组装序列alternative assembly)的构建,但是也没有从功能、群体遗传学和个人基因组的角度来考虑这一差异的重大意义。这一传统思潮的典型反映,是在人类单体型计划完成以后,出现的以芯片基因分型技术为基础来进行的复杂疾病全基因组关联分析热潮。当然,随着近期个人基因组测序的不断推进和发表,加之当前基于芯片技术的关联分析在取得了部分成果后进入困境,许多科研工作者都在重新审视人类基因组研究的技术路线问题。据我所知,国外的大基因组中心亦在用传统方法如fosmid测序等开展相应研究,但是进展不大。

 

我们这一成果之所以能够领先一步,主要归功于具有国际领先地位的新一代测序数据实用全基因组组装技术的自主研发完成(已在Genome Research专文发表)、我们对新测序技术的信心和技术平台的建设、以及华大基因长期基因组学基础研究所积累的经验和创新的观念。

 

生物通:.泛基因组概念的提出对探索人类生命、疾病奥秘有什么意义?这个课题将沿着什么样的方向走下去?您下一步打算进行哪些研究?

 

李英睿: 人类泛基因组概念的提出改变了我们对个人基因组和个性化医学的认识。它首次从数据上无可辩驳地证明:一个人的完整遗传信息只有可能通过对他自己的全基因组测序和组装才能够得出,而无法通过与参照基因组比较找差异得出,这是对现有基于芯片技术的全基因组关联分析的一个挑战。无论是研究疾病易感性差异,还是药物反应性差异,抑或其他具有个人特性的医学与健康研究,我们都需要考虑这一点。因此,这个课题将继续向解读人类生命与健康生活的"完整"遗传学基础继续推进。

 

生物通:你们的文章中提及,基因组中有19-40Mb的序列是新序列,这个数量级意味着什么?

 

李英睿: 这一数量约相当于人类基因组总大小的1%,比之前对人类基因组之间的直接序列差异(即不包括序列重排)的估计值要高出一倍。

 

生物通:.可以介绍一下,你们几个共同第一作者分别有哪些分工吗?比如,谁主要负责写论文,谁主要负责做课题之类的?

 

李英睿:  这个课题是在汪建教授和王俊教授的设计和指导下完成的。四名第一作者中,李瑞强博士负责了完整的具体的研究方案设计和文章写作,李英睿负责研究课题的执行和部分文章写作,郑汉城和罗锐邦同学负责生物信息分析软件的研发和数据分析。(罗锐邦同学年方20是华南理工大学大学三年级的本科生,在华大基因-华南理工合作创新班的框架下也在华大基因实习工作,他在同样的年龄取得的成就比我大得多。)

 

生物通:你们的研究小组用什么技术分析人类泛基因组中的新序列?您认为比较关键的技术是什么?相比绘制炎黄1号基因组图谱,泛基因组的新序列分析哪个更难?

 

李英睿:我们对序列的分析大部分通过提出新设想,然后自主开发生物信息分析流程实现来完成。其中最关键的技术是新一代测序技术的组装算法,如前所述,这也是我们能够领先发表这一成果的主要原因之一。相对于去年发表的,基于新一代序列比对和多态性检出算法的炎黄1号图谱来说,泛基因组构建的关键技术(序列组装)实现更难,但是在数据的注释和分析上要单纯一些。打个比方,炎黄一号是攀登处女峰,步步为营,步步维艰;泛基因组构建是飞越大裂谷,一鼓作气以后一马平川。

 

生物通:.研究人类基因组需要多种学科的交融,您如何看待生命科学领域的交叉科学?

 

李英睿:毫无疑问,生命科学已经进入了历史上最激动人心的大科学时代。以基因组学为例,其前沿交织了不同自然科学领域的科研工作者的共同智慧,以不可思议的速度向前发展。与其我们讲生命科学领域的交叉科学,更不如说是以生命为研究主体,各个学科的联合研究吧。

 

生物通:目前,全球第三代测序技术正如火如荼地进行,您认为测序技术的进步将给生命科学研究人员带来什么样的变化?华大基因研究院有没有参与我国的第三代测序技术的研发,如果有,可以简单介绍一下吗?

 

李英睿: 测序技术的进步极大地降低了基础科学研究和应用科学研究的门槛,让研究人员能够更多的专注于生物学意义的阐释。测序技术的进步最终将达到生命信息的数字化和系统规律的总结,从而完成实验生物学向理论生物学的迈进。华大基因目前暂时没有参与我国的第三代测序技术的研发,但是我们愿意以自己的技术平台优势与有明确前景的第三代测序技术进行评估、测试和应用开发。

 

生物通:与测序技术相比,软件分析应该也十分重要,贵研究组选用的是什么软件,可以介绍一下吗?

 

李英睿: 在新测序技术相关的生物信息研究方面,我们主要通过自主开发生物信息工具和脚本来进行分析,从而保证技术和科学研究的领先性。目前一部分完成整理的工具软件已经在Genome Research, Bioinformatics等期刊上发表,并整合在一个软件包内,供全世界的科研工作者自由使用。这个软件包叫做SOAP(Short Oligonucleotide Analysis Package),主要目的是为生物信息工作者提供实用的新一代测序技术的基础生物信息工具,可以从华大基因的网站下下载到(http://soap.genomics.org.cn)

 

(生物通 张欢)

 

基本情况:

姓名:李英睿

出生年月:1986 5 24

出生地:四川成都

 

职务:

2009.8 至今  科学体系第一负责人,深圳华大基因研究院 

2007.5~2009.7  生物信息中心副主管,深圳华大基因研究院

2006.62007.4 生物信息部实习员工,北京华大基因研究中心

 

研究经历

李英睿,现任深圳华大基因研究院,科学体系第一负责人,2008 年毕业于北京大学,获北京大学生物科学学士。大二暑假就开始在华大进行项目的实战训练,1年之后迅速成长为学科带头人。2007 ~2008年,作为炎黄一号生物信息分析主要负责人之一,其研究成果“第一个亚洲人的基因组图谱”发表在国际著名杂志《Nature》上,成为国内在《Nature上以第一作者发表文章的本科生之一。其后,李英睿带领团队负责一系列华大基因重大项目的攻坚,包括基因组多态性识别软件的开发,国际千人基因组计划,中丹糖尿病研究计划,全基因组外显子组测序数据分析方法学的建立,炎黄99等。上述研究成果已经发表或者陆续投稿《Nature Science》等国际杂志。如今,李英睿作为华大基因的科学体系负责人,带领团队在复杂疾病、癌症、分子育种、进化等多领域开展基于基因组学技术的研究工作。

 

教育背景:

2004.9~2008.6  北京大学,生物科学,生物学学士

 

主要发表论文 2008~2009年度主要发表论文11篇。

其中第一作者或并列第一作者(#4篇。

1.  Li R, Zhu H, Ruan J, Qian W, Fang X, Shi Z, Li Y, Li S, Shan G, Kristiansen K et al: De novo assembly of human genomes with massively parallel short read sequencing. Genome Res. 2009.

2.  Li R, Fan W, Tian G, Zhu H, He L, Cai J, Huang Q, Cai Q, Li B, Bai Y, …Li Y et al: The sequence and de novo assembly of the giant panda genome. Nature. 2009.

3.  Li R, Li Y#, Zheng H, Luo R, Zhu H, Li Q, Qian W, Ren Y, Tian G, Li J et al: Building the

sequence map of the human pan-genome. Nat Biotechnol. 2009.

4.  Huang S, Li R, Zhang Z, Li L, Gu X, Fan W, Lucas WJ, Wang X, Xie B, Ni P,...Li Y, et al: The genome of the cucumber, Cucumis sativus L. Nat Genet. 2009.

5.  Li Y#, Wang J: Faster human genome sequencing. Nat Biotechnol. 2009, 27(9):820-821.

6.  Xia Q, Guo Y, Zhang Z, Li D, Xuan Z, Li Z, Dai F, Li Y, Cheng D, Li R et al: Complete

Resequencing of 40 Genomes Reveals Domestication Events and Genes in Silkworm (Bombyx).

Science. 2009.

7.  Li R, Yu C, Li Y, Lam TW, Yiu SM, Kristiansen K, Wang J: SOAP2: an improved ultrafast tool for short read alignment. Bioinformatics. 2009, 25(15):1966-1967.

8.  Li R, Li Y#, Fang X, Yang H, Wang J, Kristiansen K: SNP detection for massively parallel

whole-genome resequencing. Genome Res. 2009, 19(6):1124-1132.

9.  Li G, Ma L, Song C, Yang Z, Wang X, Huang H, Li Y, Li R, Zhang X, Yang H et al: The YH

database: the first Asian diploid genome database. Nucleic Acids Res. 2009, 37(Database

issue):D1025-1028.

10.  Wang J,  Wang W,  Li  R,  Li Y#, Tian G, Goodman L, Fan W, Zhang J, Li J, Guo Y et al: The diploid genome sequence of an Asian individual. Nature. 2008, 456(7218):60-65.

11.  Li R, Li Y, Kristiansen K, Wang J: SOAP: short oligonucleotide alignment program.

Bioinformatics. 2008, 24(5):713-714.

 

 

 

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号