原核生物系统学的环境基因组学实用指南:从MAGs/SAGs到SeqCode命名规范

【字体: 时间:2025年08月18日 来源:Systematic and Applied Microbiology 4.2

编辑推荐:

  推荐:本文针对未培养原核生物基因组命名混乱和数据库质量参差的问题,系统梳理了环境基因组学(MAGs/SAGs)从样本处理、基因组组装(SPAdes/MEGAHIT)、质量评估(CheckM/GUNC)到SeqCode命名注册的全流程技术方案,为微生物组研究提供了标准化操作框架,对推动微生物分类学和生态学研究具有重要意义。

  

微生物世界蕴藏着地球上最丰富的生物多样性,但超过99%的原核生物仍无法通过传统培养方法获得命名资格。随着高通量测序技术的爆发式发展,宏基因组组装基因组(MAGs)和单细胞扩增基因组(SAGs)技术虽已揭示大量未知微生物类群,却面临两大严峻挑战:一方面,序列数据库中堆积着质量参差不齐的基因组数据;另一方面,未培养微生物缺乏稳定的命名体系,导致科学交流和数据整合困难重重。奥地利因斯布鲁克大学(University of Innsbruck)微生物系的Nathan M. Ernster和Luis M. Rodriguez-R在《Systematic and Applied Microbiology》发表的研究,系统提出了基于SeqCode的解决方案。

研究人员通过整合11种MAGs回收流程(如Anvi'o、MetaWRAP)、32种基因组抛光工具(如Nanopolish、Pilon)和自动化命名系统GAN,构建了从样本采集到SeqCode注册的全链条技术指南。关键技术包括:1)采用混合组装策略提升复杂样本的基因组完整性;2)通过CheckM2和GUNC评估基因组污染与嵌合体;3)利用GTDB-Tk和Protologger实现自动化分类与性状预测;4)基于95% ANI(平均核苷酸相似性)和65% AAI(平均氨基酸相似性)阈值界定新分类单元。

基因组质量评估

研究强调MAGs需满足MIMAG标准:完整性>90%、污染<5%,且需包含tRNA和rRNA基因。通过案例研究证实,对2006年南极蓝藻基因组GCF_000153045.1进行SPAdes v3.15.5重组装后,污染率从10.4%降至1.9%,成功注册为SeqCode模式菌株Regnicoccus antarcticus。

分类学框架创新

突破性地将基因组分类标准(如GTDB的RED值)与生态分布数据结合,提出"基因组-生态"双维度分类描述范式。例如,通过RecruitPlotEasy分析测序深度分布,可验证微生物在特定生境中的真实存在。

命名法革新

批判性分析了ICNP(国际原核生物命名法规)对纯培养要求的局限性,详细阐释SeqCode如何以基因组为模式材料实现命名稳定性。研究特别展示了自动化命名工具GAN如何将GTDB中65,000个未命名物种转化为合规拉丁名。

这项研究的意义在于首次系统整合了环境基因组学的技术标准与命名法规,其提出的"质量评估-分类鉴定-生态描述-命名注册"四步法,不仅解决了未培养微生物的命名困境,更通过标准化流程(如强制要求提交原始数据至INSDC)提升了数据的可重复性。随着SeqCode注册系统的完善,该框架有望成为微生物组研究的新范式,加速从"暗物质"基因组向规范化微生物资源库的转化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号