张国捷团队连发2篇Nature文章:万种鸟类基因组计划第二阶段研究成果

【字体: 时间:2020年11月12日 来源:华大基因

编辑推荐:

  华大基因研究院、昆明动物研究所张国捷课题组联合合作者在Nature上以封面文章形式同期发表了两篇文章,报道了万种鸟类基因组计划第二阶段(科级别)的研究结果。

  

北京时间2020年11月12日凌晨0时,华大基因研究院、昆明动物研究所张国捷课题组联合合作者在Nature上以封面文章形式同期发表了两篇文章,报道了万种鸟类基因组计划第二阶段(科级别)的研究结果。

研究团队发表了363种鸟类基因组数据,同时通过这一数据建立了无参考序列下多基因组比对和分析的新方法,并基于这一新方法阐明高密度物种取样对生物多样性研究的重要性。

传统的比较基因组学分析依赖于某个基因组作为参考序列建立全基因组比对,进而开展相关的比较分析。这一方法存在两个弊端,一是因为受制于参考基因组而无法识别出其他物种特异序列或者其他物种之间的差异序列,二是因为只获取单拷贝同源区域而丢失了由分支特异复制事件所带来的一比多或多比多的同源区域。在多物种比较分析中,由于基因复制、序列丢失或获得、染色体结构变异等事件存在的情况下,如何获取更真实且全面的序列同源关系用于后续系统发生关系的解析和比较基因组学相关分析尤为关键。

针对此问题,研究团队建立了适用于多物种且无参基因组的比对算法,Cactus。该算法基于预设的简易物种关系树,将复杂的多序列比对问题分解到物种分支上,对每个分支上的物种开展两两比对并构建出其祖先基因组序列,而后再基于祖先序列将同一分支以及不同分支的物种基因组排比在一起,从而构建出无参考序列的多基因组比对信息。

这一方法成功地解决了现有多序列比对软件的弊端。该方法也极大的提高了跨物种的比对效率,减少了由于与参考物种遗传距离差异引起的比对偏好何序列丢失。比如以363只鸟类基因组构建的全基因组比对序列总长为981Mb,比之前以鸡和斑胸草雀为参考基因组构建的48只鸟类全基因组比对序列在长度上提升了149%。该方法文章以“Progressive Cactus: a multiple-genome aligner for the thousand-genome era”为题,张国捷教授和加州大学圣克鲁斯分校的Benedict Paten为文章的共同通讯。

无参的全基因组比对数据集为全面解析鸟类遗传多样性特征的演化历程和分子遗传机制提供了全新的切入点。在另外一篇文章“Dense sampling of bird diversity increases power of comparative genomics”中,张国捷研究团队借助Cactus这一算法的优势建立了更加完善的同源基因集合,还开发了一套鉴定任意演化分支特异获得和丢失序列的方法,从而完整描绘出出鸟类物种谱系基因组动态演化图谱。

研究发现这些动态变化的基因组区域往往存在一些分支特异基因或调控元件,可能与物种特异性状的起源和演化有关。比如雀形目鸟类基因组多出一个生长激素基因的拷贝。而雀形目中的鸣禽丢失了cornulin基因,该基因在食管和口腔上皮表达,其丢失可能导致了鸣禽食管上皮细胞的弹性变化,从而使得鸣禽能够发出更加多样化的声音。

此外,研究发现基于高覆盖度的物种取样的基因组比较分析显著提高了对基因组序列保守性的检验效力,实现了在单碱基分辨度下的自然选择压力分析。相比于53个物种的比较分析,363个物种计算得到的单碱基保守位点从2.1%上升到13.2%。当一基因组序列对物种类群演化至关重要时,基因组序列一般在跨物种比较中会展示出很高的序列一致性。当比较的物种比较少时(<50个),一般只能通过严格筛选演化速率近乎为0的基因组区域来作为超保守区域,因此只能检测出受到及其强烈自然选择的基因组区域。而高覆盖度的物种比较分析可以极大提高对基因组选择压力的检测灵敏度,文章以鸟类数据为例,高覆盖度的物种数据可以允许演化速率不为0,甚至在接近中性演化速率下仍可检测出受到自然选择的区域。这些区域可能在演化过程中由于在某些物种分支上提供特殊适应性功能,从而受到较弱的自然选择压力(soft selection)。这些区域对揭示物种类群的分化具有重要意义。

万种鸟基因组学计划旨在构建所有现生约10500种鸟类的基因组图谱,该项目由深圳国家基因库、中国科学院、哥本哈根大学、史密森博物馆、深圳华大基因研究院以及洛克菲勒大学共同主导。目前发表的研究工作是该计划第二阶段科级别的最新研究成果。科研团队从现存鸟类的科阶元中选取一个代表性鸟类物种,共计获得363只鸟类的全基因组数据覆盖92%的科阶元,其中267个物种的基因组数据为首次发布。

项目所使用的样品主要来源于全球多个博物馆所保存的鸟类组织样品。其中美国史密森博物馆、丹麦自然博物馆和路易斯安那州立大学自然博物馆为该项目贡献了大部分样品。这使得研究团队能够对一些稀有的和濒危的鸟类物种进行基因组测序,这将会物种保育提供重要的基因组资源。本研究中,首次发布的267个物种基因组使用华大基因自主研发的BGISEQ500平台测序完成。

原文链接:

https://doi.org/10.1038/s41586-020-2871-y

https://doi.org/10.1038/s41586-020-2873-9

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号