韩国人基因组研究最新成果

【字体: 时间:2011年07月08日 来源:生物通

编辑推荐:

  生物通报道,韩国首尔大学领导的研究小组近日在《Nature Genetics》杂志上发表了一篇文章,介绍了他们对韩国人基因组、外显子组和转录组的研究成果。研究人员测序了10个全基因组、8个外显子组和17个转录组,鉴定出数百万个SNP,其中很多都未曾报道过。

  

生物通报道,韩国首尔大学领导的研究小组近日在《Nature Genetics》杂志上发表了一篇文章,介绍了他们对韩国人基因组、外显子组和转录组的研究成果。

研究人员测序了10个全基因组、8个外显子组和17个转录组,鉴定出数百万个SNP,其中很多都未曾报道过。研究还发现了大量的小插入缺失,数千个新转录本,以及1800多个“奇怪”的位点,在这些位点,同一个人的DNA和RNA序列无法相互对应。

文章的通讯作者,首尔大学的Jeong-Sun Seo谈到:“我们的结果表明,在人类基因组中,仍有相当一部分的基因组变异有待鉴定。”同时,他认为,基因组和转录组测序的综合分析对于了解人类基因组变异的多样性和功能很有用。

尽管研究人员发现了如此多的SNP和结构变异,但他们认为,还需要更多的工作,才能找到与人类性状和疾病相关的遗传变异。于是,他们将同一个个体的基因组和转录组信息关联起来,试图用这种策略来更详细地查看遗传变异及它们的后果。

研究人员使用Illumina GAIIxLife Technologies SOLiD平台对韩国的5名男性和5名女性的基因组进行了测序,平均覆盖度约为26倍。对于另外6名韩国男性和2名女性,他们利用安捷伦的SureSelect Human All Exon Kit捕获了外显子组,并以近64倍的深度进行了测序。

在随后的分析中,他们在外显子组序列中检测到35,740个SNP,在基因组中检测到837万个SNP,其中有183万个SNP过去从未报道过。在新的SNP中,大约四分之三似乎是非常稀有的,在这次测序的10个基因组中只有一个出现,而其他的似乎在韩国人中较为常见。总的来说,每个基因组包含了345-373万个SNP,平均包括8,431个非同义SNP。

这10个韩国人基因组还包含了近120万个小插入缺失,以及近5,500个大的缺失,而8个外显子组中出现了15,697个插入缺失。全基因组序列中几乎三分之一的插入缺失不在dbSNP数据库中。

研究人员还利用Illumina末端配对测序对来自17个个体的淋巴母细胞系中的mRNA进行了测序,发现了4,414个过去未曾注释的转录本,但出现在至少两个新测序的转录组中。

有趣的是,将基因组和转录组的数据整合,研究小组还发现了一些“奇怪”的位点。在这些位点上,转录本中的RNA序列与编码这些转录本的DNA序列无法对应。他们称之为“转录碱基修饰”(transcriptional base modifications,简称TBM)。在1809个TBM中,有188个位于蛋白编码基因中,而其余的位于非翻译区,暗示这些TBM可能与疾病相关。

作者认为,TBM可能影响了复杂疾病的易感性,因为它们可能改变了mRNA稳定性以及蛋白的氨基酸序列。可能需要对更多患病个体的多个组织进行深度的基因组和转录组测序,才能评估TBM的分布以及功能影响。(生物通 薄荷)

原文摘要:

Extensive genomic and transcriptional diversity identified through massively parallel DNA and RNA sequencing of eighteen Korean individuals

Nature Genetics  (2011) doi:10.1038/ng.872

摘要:
Massively parallel sequencing technologies have identified a broad spectrum of human genome diversity. Here we deep sequenced and correlated 18 genomes and 17 transcriptomes of unrelated Korean individuals. This has allowed us to construct a genome-wide map of common and rare variants and also identify variants formed during DNA-RNA transcription. We identified 9.56 million genomic variants, 23.2% of which appear to be previously unidentified. From transcriptome sequencing, we discovered 4,414 transcripts not previously annotated. Finally, we revealed 1,809 sites of transcriptional base modification, where the transcriptional landscape is different from the corresponding genomic sequences, and 580 sites of allele-specific expression. Our findings suggest that a considerable number of unexplored genomic variants still remain to be identified in the human genome, and that the integrated analysis of genome and transcriptome sequencing is powerful for understanding the diversity and functional aspects of human genomic variants.

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号