海洋微生物多组学数据库Ocean-M:全球尺度海洋微生物研究的集成平台

《Nucleic Acids Research》:Ocean-M: an integrated global-scale multi-omics database for marine microbial diversity, function and ecological interactions

【字体: 时间:2025年11月01日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本研究针对海洋微生物多组学数据整合与分析的挑战,开发了Ocean-M数据库,集成了54 083个高质量宏基因组组装基因组(MAGs)和57 288个多组学数据集,构建了微生物互作网络和功能基因图谱,为海洋微生物生态学和生物技术发现提供了重要资源。

  
海洋覆盖了地球表面的70%以上,其中微生物群落作为海洋生态系统功能的关键驱动者,贡献了近一半的海洋初级生产力,在营养循环、气候调节和生态稳定中发挥着至关重要的作用。然而,海洋微生物的绝大部分仍属于"微生物暗物质",其多样性、功能及生态相互作用尚未被充分探索。近年来,随着Tara Oceans、全球海洋采样(GOS)等大型海洋科考计划的推进,产生了海量的元组学数据,包括宏基因组学、宏转录组学、宏蛋白质组学和宏代谢组学数据。这些数据为深入理解海洋微生物世界提供了前所未有的机遇,但同时也带来了巨大的挑战:数据的复杂性、异质性以及分散存储在不同数据库中的现状,严重阻碍了科研人员对微生物群落生态角色和适应策略的系统性解析。
目前,虽然已有一些数据库专注于海洋微生物数据的特定方面,如Planet Microbe侧重于多源元数据整合,Ocean Gene Atlas提供标准化的基因/基因组目录,但缺乏一个能够整合多组学数据、揭示微生物相互作用、并支持功能基因挖掘的统一平台。特别是对于微生物互作网络、宿主-微生物互作关系以及功能基因的生物技术应用潜力等方面,现有数据库的覆盖深度和广度均显不足。为了填补这一空白,中国海洋大学的研究团队开发了Ocean-M数据库,旨在为全球科研人员提供一个全面、公开的海洋微生物多组学数据整合、分析与可视化平台。
本研究主要基于生物信息学整合分析方法,对来自多个公共数据库(如GOMC、OMD、MGnify等)的352 605个宏基因组组装基因组(MAGs)进行去冗余处理,最终获得54 083个高质量海洋来源MAGs作为核心数据集。利用CheckM评估基因组质量,GTDB进行物种分类,UMAP进行基因组聚类分析。功能注释通过EggNOG和KEGG等工具完成,微生物互作网络采用FlashWeave算法构建。功能基因挖掘使用antiSMASH(BGCs)、CRISPRCasTyper(CRISPR-Cas系统)、CARD(ARGs)等专业工具。多组学数据整合涵盖13 337个宏转录组、7 764个宏蛋白质组和109个宏代谢组项目。
基因组资源整合
Ocean-M数据库系统整合了10 718个宏基因组样本和54 083个高质量MAGs,涵盖169个门和18 152个物种。通过"浏览"模块,用户可根据生物群落类型、地理定位、深度等元数据筛选样本,并通过交互式地图探索样本分布。"宏基因组"模块提供每个MAG的组装质量指标、分类学注释和全球丰度分布可视化。UMAP聚类分析揭示了海洋微生物的生物地理分布模式,而"泛基因组"模块则展示了757个细菌物种和61个古菌物种的基因簇分布特征,包括抗性基因和参与碳、氮、硫、磷代谢的关键基因。
功能元组学分析
Ocean-M创新性地整合了宏转录组、宏蛋白质组和宏代谢组数据。宏转录组模块分析了1337个数据集,展示功能基因(如生物地球化学标记基因、CAZymes等)的表达谱;宏蛋白质组模块包含7764个样本的蛋白质鉴定结果;宏代谢组模块整合了109项研究中的8526种代谢物,提供化学结构和生物学功能注释。这些模块共同支持微生物群落功能的动态追踪和生态学解读。
生态相互作用
该模块涵盖微生物互作网络、宿主-微生物互作和环境DNA(eDNA)分析。微生物互作网络基于419个宏基因组样本构建了21个区域共现网络,用户可自定义连接阈值探索特定生态位中的微生物关联。宿主-微生物互作模块整合了142个项目的175个宿主物种和9109个微生物数据,支持物种级丰度分析和微生物群落可视化。eDNA模块系统集成了301个eDNA项目,基于DADA2和SILVA数据库进行物种鉴定,为海洋生态系统监测提供标准化工具。
生物地球化学循环
该模块详细注释了参与碳、氮、磷、硫等元素循环的功能基因,通过METABOLIC v4.0平台评估通路完整性,并分析基因在不同分类群和地理环境中的分布。用户可查看包含特定基因的MAGs列表,并通过热图可视化基因的分布模式,为理解微生物在全球元素循环中的作用提供重要依据。
功能基因图谱与生物勘探
Ocean-M系统挖掘了54 083个MAGs中的功能基因,包括151 798个生物合成基因簇(BGCs)、10 960个CRISPR-Cas元件、52 699个抗生素抗性基因(ARGs)、5 786 421个碳水化合物活性酶(CAZymes)、7 228 908个塑料活性酶(PAZymes)和23 208个抗菌肽(AMPs)。每个功能基因类别均设有专门的注释模块,支持基因信息的跨维度检索,并与对应的宏基因组数据交叉链接。
Ocean-M数据库的建立标志着海洋微生物研究进入了多组学整合的新阶段。该平台不仅解决了海洋微生物数据分散、难以整合的痛点,还通过创新的可视化工具和交互式界面,降低了数据挖掘的技术门槛。其大规模的功能基因目录为新型生物活性物质的发现提供了宝贵资源,特别是在抗生素开发、酶工程和生物修复等领域具有广阔应用前景。此外,微生物互作网络和宿主-微生物互作数据的整合,为理解海洋生态系统的稳定性和恢复力提供了新视角。随着海洋环境变化的加剧,Ocean-M将持续更新和扩展,为全球科研人员探索海洋微生物世界的奥秘提供强大支持,推动海洋微生物生态学、生物地理学和功能基因发现研究的深入发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号