VIRE:全球规模宏基因组病毒组资源库的构建及其环境背景整合分析

《Nucleic Acids Research》:VIRE: a metagenome-derived, planetary-scale virome resource with environmental context

【字体: 时间:2025年11月30日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本刊编辑推荐:为系统探索地球上最丰富却认知有限的病毒多样性,研究人员开发了VIRE资源库,从>10万份公共宏基因组中整合了>170万株高质量病毒基因组,提供基因组完整性、分类、宿主预测(基于CRISPR spacer)和功能注释(如eggNOG/PHROG/KEGG)。该平台与SPIRE/Metalog资源互联,首次实现病毒基因组、微生物宏基因组组装基因组(MAGs)及环境/临床元数据的联合分析,为行星尺度病毒生态进化研究提供开放平台。

  
病毒是地球上最丰富的生物实体,数量高达1031颗粒,然而由于传统培养技术的限制,全球病毒多样性仍大部分处于“暗物质”状态。尤其噬菌体作为细菌的主要捕食者,通过调控微生物群落结构、介导水平基因转移和驱动生物地球化学循环,深刻影响着生态系统功能。尽管高通量测序技术推动了宏基因组学发展,现有病毒基因组数据库多局限于特定环境(如人类肠道、海洋),缺乏跨生态系统的整合分析平台。
为解决这一难题,欧洲分子生物学实验室(EMBL)Peer Bork团队联合东京大学、科克大学等机构在《Nucleic Acids Research》发表了VIRE(Viral Integrated Resource across Ecosystems)资源库。该研究从101,623份公共宏基因组中重建了178.4万个中高质量病毒基因组(含38.4万完整基因组),规模超越现有最大数据库IMG/VR v4,新增56.1%的物种级新簇。通过统一流程进行基因组质量评估(CheckV)、分类注释(geNomad)和功能分析,并创新性地整合CRISPR spacer匹配(从120万MAGs和100万参考基因组中提取)实现宿主预测,首次构建了涵盖水生、陆生、宿主相关等多元环境的行星尺度病毒资源库。
研究采用的核心技术包括:1)从ENA/SRA获取101,623份宏基因组数据,经MEGAHIT组装后筛选>5 kb(常规样本)/2 kb(病毒组样本)的contig;2)使用geNomad(病毒评分≥0.7)和CheckV(完整性≥50%且污染<10%)鉴定病毒基因组,并过滤rRNA基因;3)通过vclust以95%/70% ANI(85% AF)进行物种/属级聚类;4)基于SPIRE MAGs和proGenomes数据库的CRISPR spacer完美匹配预测宿主;5)利用prodigal-gv预测基因,结合eggNOG-mapper、MetaCerberus等多工具进行功能注释。
基因组概览与环境分布
VIRE中87.2%基因组属于双链DNA尾病毒域(Duplodnaviria),9.2%为单链DNA病毒(Monodnaviria)。人类肠道样本贡献52.9%的基因组,其次为水生(18.7%)和陆生环境(6.4%)。
稀有曲线分析显示多数环境(如热液喷口、苔原)的物种发现系数>0.8,表明病毒多样性远未饱和。
宿主注释与遗传特征
基于CRISPR spacer的宿主预测覆盖46.8%病毒基因组,涉及2,367个细菌/古菌属。研究发现感染拟杆菌门(Bacteroidota)的病毒中4.0%使用非标准遗传密码15(如Crassvirales目),而感染Patescibacteria的病毒7.5%使用遗传密码4,反映病毒对宿主翻译系统的适应性进化。
功能注释与生态适应
从8,946万预测基因中,40.2%获功能注释(eggNOG覆盖51.4%)。水生病毒富含辅助代谢基因(AMG),涉及辅酶代谢和碳水化合物代谢;而宿主相关病毒AMG集中于氨基酸代谢。
抗生素耐药基因仅检出618个(如ACI-1),97.2%来源于宿主环境,印证噬菌体罕见携带耐药基因的规律。
VIRE通过标识符与SPIRE(微生物MAGs库)、Metalog(样本元数据库)无缝集成,支持病毒-微生物-环境多维关联分析。该平台不仅为病毒分类、宿主互作和AMG功能研究提供数据基石,其开放架构(https://vire.embl.de)更助力新兴人畜共患病预警和生态系统建模。随着长读长测序与转录组数据的整合,VIRE将持续推动行星尺度病毒生态学的范式革新。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号