Nature子刊:从宏基因组数据中挖掘出更多的完整基因组

【字体: 时间:2022年01月06日 来源:生物通

编辑推荐:

  一项新研究展示了长读长测序和染色体构象分析的组合能够帮助人们从复杂的宏基因组样本中回收近缘物种的基因组。

  

美国农业部和加州大学圣地亚哥分校领导的研究团队利用Pacific Bioscience的HiFi测序数据和Phase Genomics的Hi-C连锁数据,从绵羊粪便样本中生成了完整的宏基因组组装基因组(MAG)。

他们鉴定出428个完整度超过90%的MAG,其中44个位于单个环状重叠群中。此外,他们还能解析亲缘关系接近的微生物,改善生物合成基因簇的鉴定,并更精确地将移动遗传元件分配给宿主基因组。这项成果于本周发表在《Nature Biotechnology》杂志上。

作者在文中写道:“我们利用Hi-C数据确定了1400个完整的生物合成基因簇和350个部分的生物合成基因簇(其中大部分是新的),以及424个潜在的宿主-病毒关联(包括298个宿主-质粒关联)。”

加州大学圣地亚哥分校的Pavel Pevzner表示,这项工作是基于基因组组装的最新进展之上的,其中的一些技术曾协助Telomere-to-Telomere联盟在2020年建立了第一个无缺口的人类染色体组装,并在2021年6月完成了完整人类基因组的组装。他是这篇论文的共同通讯作者。

“过去的宏基因组学几乎从来没有组装过一个完整的基因组,”他谈道。“HiFi reads让我们能够生成近乎完整的宏基因组图像,而不仅仅是片段化的组装。”

正如人类基因组组装一样,研究人员在组装细菌基因组时也一直受到高度重复区域的影响,而这些区域很难通过短读长测序来处理。对于人类来说,这些重复区域是着丝粒;但对于细菌而言,它们是生物合成基因簇(BGC)。

研究人员利用HiFi reads来分析基因组,并利用Hi-C数据对重叠群进行分箱(bin)。他们还采用了一种由Pevzner实验室开发的组装算法——metaFlye。同时,他们还用PacBio的程序MAGPhase来区分单个样本中非常相似的细菌菌株。“这非同小可:有些菌株是无害的,有些则是致命的,”Pevzner说。

他认为,基因组组装的改进有着广泛的应用。例如,人们对生物合成基因簇进行测序后,可以将其用于抗生素的药物开发。“生物合成基因簇有着巨大的多样性,因此抗生素也种类繁多,”他说。

美国农业部肉类动物研究中心的科学家Timothy Smith认为,鉴定绵羊及其他牲畜的微生物组还有助于开发方法来减少疾病和温室气体排放。“菌株水平的基因组解析将有助于追踪与抗生素耐药性有关的基因,并确定畜牧业导致人类和动物疾病中抗生素耐药性上升的程度。”

Pevzner预测,过不了多久,研究人员就会将这些方法应用在人类微生物组样本上。“就像将完整基因组应用于罕见病诊断一样,完整宏基因组学也许很快也会进入医学及其他学科,”他说。

原文检索

Bickhart, D.M., Kolmogorov, M., Tseng, E. et al. Generating lineage-resolved, complete metagenome-assembled genomes from complex microbial communities. Nat Biotechnol (2022). https://doi.org/10.1038/s41587-021-01130-z

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号