专访BIG测序专家胡松年研究员

【字体: 时间:2009年10月09日 来源:生物通

编辑推荐:

  胡松年,研究员,2003年至今任中科院北京基因组研究所(BIG)所长助理,基因组生物信息学平台负责人。自1999年到2009年的十年间,胡松年研究员一直在和测序打交道。谈到新一代测序,我想他是最有发言权的。于是,生物通就新一代测序中大家关心的问题采访了胡老师。

  

胡松年,研究员,2003年至今任中科院北京基因组研究所(BIG)所长助理,基因组生物信息学平台负责人。他于1996年毕业于中国农业大学的植物生化系,后前往美国华盛顿大学基因组中心做访问学者。1999年任中科院遗传所人类基因组中心暨北京华大基因研究中心的总工程师,是国际人类基因组测序计划中国部分(1%项目)具体执行的总负责人。近年来先后承担了“籼稻基因组测序”、“大规模基因组测序技术平台的建立与优化”、“中国-丹麦家猪基因组测序”及“产黄青霉菌基因组测序”、“动植物基因组中可变剪接形式的比较分析”等重大项目。

自1999年到2009年的十年间,胡松年研究员一直在和测序打交道。谈到新一代测序,我想他是最有发言权的。于是,生物通就新一代测序中大家关心的问题采访了胡老师。当天他正在面试,不过还是抽空接受了我们的访问。

生物通:请您介绍一下中科院北京基因组研究所以及它现有的测序平台?近期主要成果有哪些?

胡老师:北京基因组研究所是在2003年正式挂牌成立的。它的前身是华大基因,之前有很多项目是由两个单位共同完成的。到了2007年,院里考虑到整个科研的需要,又正好碰上搬家,于是基因组研究所就完全独立出来。研究所已经独立完成了“中国超级杂交水稻基因组计划”、家蚕基因组计划及家鸡基因多态性图谱等一系列的科学项目。目前所里有9台SOLiD、4台Solexa(Illumina)以及3台3730测序仪,还有一台454的GS FLX将于8月份到位。最近主要是应用SOLiD来进行一些研究。去年,国家水稻基因组计划的韩斌老师也加入了我们所,我们正在开展一些水稻的测序和研究。

生物通:选择测序新平台的标准是什么?您最看重的是哪些因素?

胡老师:对研究所来说,它更看重的是实验技术和实验方法的提高。这些新一代的测序平台各有各的特点,没有一台机器就好到能包揽所有的项目。最重要的是研究各种仪器的特点,然后针对不同的项目来进行选择,让这些仪器的优势能发挥出来。这些仪器目前的价格都差不多,我看主要还是根据自己的研究目的来选择合适的仪器。

生物通:目前主流的3大新一代测序平台,它们各有哪些长处?您的评价如何?它们分别适用于哪些研究?

胡老师:这3种测序平台我都用过。454给大家的感觉是和以前的3730更相像。它在升级后,读长达到400 bp,与其他两种仪器相比,这是它的最大优势。因此更适合于新物种的de novo测序。而SOLiD和Solexa则有些类似,它们的读长都比较短,但通量高,因此更适合于大基因组的重测序和转录组研究,比如真核生物的基因组。SOLiD是采用双碱基编码的原理,双色球信息对于一些刚开始从事基因组测序的人来说,会有些不适应,觉得不太直观。但是它的通量更高,每次运行能得到30-50 GB的数据。这么高的通量对大基因组的测序而言,在成本上就更有优势。Solexa上市得比较早,所以文献相对多一些,SOLiD和Solexa的读长都比较较短,因此更适合于有reference的基因组测序。

其实,在很多时候还是应该将长(读长)和短(读长)的方法结合起来,才能得到一个更为理想的结果。对于de novo的基因组测序,一般都是先用454去绘一个草图,再用短读长的仪器来填充,因为它们的通量更高,更为经济。

生物通:比较其它新一代测序仪,您认为SOLiD最大的优势是什么?

胡老师:除了通量高,SOLiD在转录组测序上优势更为明显。它是将RNA(总RNA或mRNA)直接打断,这样,它就和以往的测序不同,既能测出正义链的表达,也能测出反义链的表达。现在很多人认为antisense也像小RNA一样,起到重要的调控作用。而且,它还能看到一些非编码重复序列的表达。另外,对于大的基因组测序,从整体上来看,SOLiD可能更为经济一些。

生物通:您对测序的前景有何展望?对于已经初露端倪的第三代测序您怎么看?

胡老师:第三代测序已经有些苗头了,也可能很快就会面世。目前的主要难点还是样品制备,就是将细胞破碎之后,会有很多影响测序的杂质,在去除杂质的过程中,有可能造成DNA的断裂。现在测序技术发展很快,以后读长可能会达到几K,或者通量更高,但是不能忽视的是样本的处理。即使检测技术再强,如果样本处理时已经丢失了一半DNA,那么得到的信息也还是不完整的。

生物通:新一代测序中最大的挑战是什么?作为生物信息学的专家,你们怎么解决这个问题?北京基因组研究所主要采用哪些硬件和软件来支持数据分析?

胡老师:数据的存储和分析是新一代测序中最大的两个问题,几天下来的数据量可能就在TB级别。为了配合新一代测序仪,研究所正在与浪潮公司合作,配备了600 TB的存储空间、十万亿次的刀片服务器以及128、256 GB的大内存。在软件方面,测序仪自身也携带软件,但这些软件本身肯定既有优点,又有缺点。SOLiD和Solexa这些仪器都比较开放,它们的软件会开放源代码,而且还有一些用户群,可以互相交流。但是国内与国外的研究方向往往有很大差别,国外主要是研究人和模式动物,而国内研究植物的相当多,动植物的基因组存在较大差别,因此还是要自己根据实验目的来调整。我们通常会以项目为导向,将仪器自身的软件与网上其他一些软件进行整合,开发出自己的流程。

生物通:国内研究所主要经费往往来源是国家拨款,但和国外实验室相比还是远远不够的,利用现有实力提供部分商业化服务是一种有益的补充方案,生物通也留意到华大已经对外开展一些测序的服务。你们有没有考虑这项服务?

胡老师:北京基因组研究所作为一个科研机构,和公司还是有一定区别。我们的主要精力还是会放在科研上,我们与很多科研院所都有合作。在今年秋天,研究所还打算先在北京举办一系列技术应用型的讲座,谈谈什么项目该用什么样的仪器去做。同时,我们一直开办“基因组科学与信息”的培训班。这个培训班已经成功开办了30多期,应该是国内最长的吧。学员的反映相当不错。我们的学员遍布全国各地,有一些是研究生、博士生,也有一些老师带着课题来,想与我们交流和协作。我们不讲那些参考文献或者综述上能看到的东西,而是将我们在实际研究中的思路、心得体会传授给大家,而且讲课的老师都是在一线工作的,有着丰富的经验。另外,我们每期都会根据学员的建议来调整,再加入一些大家都关心的问题。

生物通:生命科学领域的学生应该如何转入生物信息学领域?您有何建议?

胡老师:学生物的学生一谈起要编程、搞计算机,都会有些怵,不知道怎么上手。我认为,一开始不必对自己要求太高,也不用看很多算法、概率,其实我们主要还是解决生物问题。首先要学会使用软件,有了一定经验后,再学习如何评估软件,在这个过程中再进一步了解它的大致原理,并了解哪些软件的组合适合分析这一类问题。如此,触类旁通,就能够解决更多问题。但是,必要的计算机知识也是不可少的,我们会要求学生学习Linux平台和Perl语言。总之,学东西关键是要有目的,去解决问题,慢慢地就熟能生巧了。(生物通 余亮)

生物通独家报道,谢绝转载!

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号