HiFi reads,泛基因组时代的引擎

【字体: 时间:2021年04月19日 来源:

编辑推荐:

  HiFi Reads是PacBio测序平台推出的兼顾长读长和高准确度的测序技术。在泛基因组研究中可以提供高质量的参考基因组,同时可以有效节约生信分析的时间,大大加速大型泛基因组研究的效率。

  

1. 什么是泛基因组(Pan-genome)?

泛基因组是指存在于某一物种中的全部基因序列。早在2005年,Tettelin等人提出了泛基因组概念(pangenome,pan源自希腊语‘παν’,全部的意思),主要是为细菌和古细菌物种构建的。近年来,泛基因组的概念开始应用于真核生物的研究,尤其是针对植物物种。

泛基因组分为核心基因(Core Genes)和非核心基因(Dispensable/Variable Genes),核心基因是指所有动植物品系或者菌株共有的基因;非核心基因是指在两个及以上的动植物品系或者菌株中所特有基因。通常而言,核心基因组控制着生命体基本代谢的功能而不会轻易发生改变。

非核心基因使物种具有多样性,很可能是个体产生不同性状(抗病性、抗寒性、抗旱性等)的原因,因此对非核心基因中的结构变异的研究是泛基因组重点关注的对象。

2. 为什么要做泛基因组研究?

在漫长的进化过程中,由于环境因素和人为选择的影响,不同品系的物种间都形成了极其特别的遗传性状,有效的发现和利用遗传变异是作物改良的关键,从而可以应对未来气候变化和病原菌进化的挑战。在过去的十年中,对多个谷物和豆类进行了基因组的组装,但这种单一个体的参考基因组已经不能涵盖这个物种的所有遗传信息,尤其是一些大型结构变异在影响作物农艺性状、环境适应性以及物种形成等方面具有关键作用1。

多项研究表明,选取野生近缘种(CWRs)进行泛基因组分析,能够检测在驯化和进化过程中的基因保留和缺失,进一步关联作物性状和基因结构变异的关系。例如,玉米是一种特别重要的作物,多年来一直困扰着遗传学家和育种家。玉米基因组测序具有较高挑战性,其2.3Gb的基因组中有85%是高度重复的转座子元件组成。一项研究比较了两个自交系玉米基因组片段,其中50%的序列是共享的,一半的基因是两个玉米所特有的,相比人类和黑猩猩之间同源性约为94%的相似度,物种内的多样性要大得多。拥有一个完整的全基因组来捕获一个物种的所有序列变异,将有助于在野生亲缘种中鉴定有用的变异体,从而将其引入栽培品系中,在遗传基础上培育对作物商业化至关重要的性状,并协助制定育种决策以提高效率。

3. PacBio 强势助力泛基因组研究

HiFi Reads是PacBio测序平台推出的兼顾长读长和高准确度的测序技术。作为PacBio最新的数据类型,既兼顾读长(20kb的长度)又具有高准确度(>99%准确率)的HiFi reads,不仅可以改善变异检测,减少组装时间,并能够识别复杂的基因组区域的细微差别,有助于增加基因组组装的连续性,准确性和完整性,可以实现多倍体基因分型。在泛基因组研究中可以提供高质量的参考基因组,同时可以有效节约生信分析的时间,大大加速大型泛基因组研究的效率。

从待研究物种群体中选择具有足够遗传多样性的代表来捕捉大部分变异,通常20-30品系可以完成该工作。然后对这20-30个品系进行全基因组测序以及全长转录组测序,从基因组层面和转录组层面打造高质量参考基因组。接着就可以在剩余的物种内进行低覆盖率的重测序,以进一步分类每个品系并捕获全部的变异。

“The whole notion of a single reference genome for crop plants is an antiquated concept borne out of necessity from the technological limitations of the past. Now with the capability to rapidly generate high-quality references for even the largest crop genomes, we can readily access the full complement of sequence diversity and structural variation within a crop.”

Kevin Fengler
Corteva Agriscience公司计算基因组学负责人
(Corteva Agriscience为美国大型农业化学品公司,也是世界上最大的纯农业组织)

玉米泛基因组研究2

玉米不仅是重要的农作物,而且是回答有关植物如何生长和适应不同环境的基本问题的重要研究物种。由美国国家科学基金会资助多个研究机构联合开展的玉米泛基因组研究历时不到两年完成,采用PacBio SMRT技术对27个玉米品系进行了全面的高质量的基因组组装。通过比较基因组学工具来对玉米的基因组进行分类,并评估其结构变异(结构变异和拷贝数变异)在确定农艺性状中的作用。相关研究结果通过项目网站和在年度玉米遗传大会上的CyVerse / Gramene / MaizeCODE讲习班进行传播。

苹果泛基因组研究3

美国康奈尔大学的费章君团队和美国农业部农业研究局仲干远团队联合采用PacBio HiFi reads对栽培苹果(M. domestica, Gala)和两个野生型苹果(M. sieversii和 M. sylvestris)进行了高质量的基因组测序和组装,实现了二倍体定相分析,对苹果基因组长期的遗传和驯化有了更加深入的分析和研究。文章提供了苹果遗传进化的详细遗传信息,揭示了影响苹果大小、口感、风味等多种性状的遗传信息,为后续果树育种提供了非常关键的参考依据。

鸦类泛基因组研究4

宾夕法尼亚州立大学的Weissensteiner团队对乌鸦类的鸣禽物种进行了泛基因组的研究,相关研究发表在《Nature Communications》上。乌鸦属具有典型的全黑色乌鸦羽毛图案的物种约有60个,但也有一些是黑灰相间,或者是黑白相间的图案。有研究表明,如上图中这两种图案的乌鸦看上去像两个不同的物种,但通过单核苷酸差异的比对,我们发现它们在基因组上大致相同。在 13 亿个碱基对的基因组中,只有 83 个碱基差异。

为了揭示鸦类物种的奥秘,Weissensteiner团队通过对33只乌鸦的全基因组测序和组装完成了覆盖属的系统发育树,并且精准的识别到了插入、缺失,倒位等各种变异。通过进一步的生信分析和比对,将影响羽毛颜色的基因聚焦于在NDP基因上游20 kb处一个2.25kb的LTR逆转座子的变异。

参考文献:
1. Murukarthick Jayakodi, Mona Schreiber, Nils Stein, Martin Mascher, Building pan-genome infrastructures for crop plants and their use in association genetics, DNA Research, Volume 28, Issue 1, February 2021, dsaa030, https://doi.org/10.1093/dnares/dsaa030
2. Whole-Genome Assembly of the maize NAM founders
3. Sun, X., Jiao, C., Schwaninger, H. et al. Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication. Nat Genet 52, 1423–1432 (2020). https://doi.org/10.1038/s41588-020-00723-9
4. Weissensteiner, M.H., Bunikis, I., Catalán, A. et al. Discovery and population genomics of structural variation in a songbird genus. Nat Commun 11, 3403 (2020). https://doi.org/10.1038/s41467-020-17195-4

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号