垃圾填埋场中新型巨型噬菌体、病毒编码CRISPR-Cas系统及辅助代谢基因的发现揭示病毒多样性宝库

《Virology Journal》:Discarded diversity: novel megaphages, auxiliary metabolic genes, and virally encoded CRISPR-Cas systems in landfills

【字体: 时间:2025年11月13日 来源:Virology Journal 3.8

编辑推荐:

  本研究针对工程环境中病毒多样性表征不足的问题,对北美三个市政垃圾填埋场的病毒组进行了深入分析。研究人员通过宏基因组学方法,发现了大量未被数据库收录的病毒,包括迄今第三大(~678 kbp)的巨型噬菌体基因组,揭示了垃圾填埋场特异的病毒群落结构。研究通过宿主CRISPR spacer与病毒protospacer匹配分析了病毒-宿主相互作用,识别出跨门感染潜力的病毒种群;鉴定了可能增强宿主甲烷、硫和污染物降解代谢的辅助代谢基因(AMG),包括文献未报道的新基因;发现了病毒编码的CRISPR阵列和CRISPR-Cas系统,其中一些Cas效应蛋白与已知类型差异显著,有望成为新型基因组编辑工具。这些发现表明垃圾填埋场作为异质性污染场地,是病毒多样性研究和新型生物技术工具开发的关键区域。

  
在微生物的世界里,病毒是当之无愧的“数量冠军”,其数量远超细菌和古菌一个数量级。然而,与它们在生态系统中的巨大影响力形成鲜明对比的是,病毒在参考数据库中的代表性严重不足。特别是在垃圾填埋场这类高度工程化、污染严重且对环境有重要影响的生态系统中,细菌和古菌病毒的多样性及其与宿主的相互作用更是笼罩在重重迷雾之中。这些环境中是否存在独特的病毒-宿主互动模式?病毒是否携带能帮助微生物宿主在恶劣环境中生存的特殊基因?它们是否蕴藏着能推动下一代生物技术发展的宝贵资源?这些问题吸引着科学家们不断深入探索。
为了解开这些谜团,由Nikhil A. George、Zhichao Zhou、Karthik Anantharaman和Laura A. Hug组成的研究团队在《Virology Journal》上发表了一项重要研究。他们对来自北美三个市政垃圾填埋场的27个样本进行了宏基因组学分析,旨在揭示这些环境中病毒的多样性、病毒与宿主的相互作用以及其独特的遗传系统。
研究人员运用了一系列关键的生物信息学技术来挖掘宏基因组数据。他们从三个垃圾填埋场(分别位于南安大略省(SO)、美国东北部(NEUS)和南加州(CA))获取了样本,这些样本覆盖了渗滤液井、收集池、受污染的地下水井以及渗滤液处理设施。通过对样本DNA进行测序、组装,研究人员利用VirSorter2和CheckV等工具从宏基因组中识别和评估病毒序列,并通过vRhyme进行病毒基因组分箱(Binning)。为了解析病毒与宿主的关联,他们从细菌和古菌的宏基因组组装基因组(MAGs)中提取CRISPR spacer,并与病毒protospacer进行比对。病毒编码的CRISPR阵列使用MINCED和CRISPRCasTyper等工具进行鉴定,而潜在的Cas效应蛋白则通过隐马尔可夫模型(HMM)搜索和系统发育分析进行筛选。辅助代谢基因(AMG)则通过VIBRANT软件进行预测。
病毒比例和基因组大小
研究发现,病毒DNA在垃圾填埋场宏基因组中占比在2%到13.5%之间,显示出较高的病毒丰度。共鉴定出超过97,000条长度大于5 kbp的病毒支架(Scaffold),其中包括138个巨型噬菌体(Jumbo Phage,基因组≥200 kbp)和7个被认为完整或近乎完整的超巨型噬菌体(Megaphage,基因组≥500 kbp)。尤为引人注目的是,一个来自SO_2017样本的噬菌体基因组大小约为678 kbp,这是目前已知的第三大噬菌体基因组。这些巨型噬菌体携带大量基因(643至1128个)和10-20个预测的AMG。
垃圾填埋场病毒的多样性和分类学
病毒群落多样性分析显示,垃圾填埋场病毒组与其他环境(如地下水、废水、厌氧消化器)的病毒组重叠有限,仅有约13.8%的垃圾填埋场病毒元素与参考数据库中的病毒聚类。不同垃圾填埋场之间的病毒群落也差异显著,例如,CA_2019垃圾填埋场的病毒群落与其他两个场地最为不同。绝大多数(约97%)的病毒被归类为有尾病毒目(Caudoviricetes),但能鉴定到目或科水平的病毒很少(约1.7%),表明垃圾填埋场中存在大量未被充分认识的病毒谱系。
垃圾填埋场内部和之间的病毒-宿主联系
通过宿主CRISPR spacer与病毒protospacer的匹配,研究人员构建了病毒-宿主互作网络。他们发现了被单一宿主大量CRISPR spacer靶向的“超靶向”病毒种群。更令人惊讶的是,研究预测了6个病毒种群可能具有跨细菌门类感染的能力,其中一个病毒种群甚至被预测能感染拟杆菌门(Bacteroidota)、Cloacimonadota和厚壁菌门(Firmicutes_B)这三个不同门的宿主。尽管这些预测经过了人工核查,但其跨门感染能力仍需后续湿实验验证。三个巨型噬菌体被确凿地连接到特定的宿主MAGs。
跨废物场的CRISPR spacer保守性
分析发现,来自同一垃圾填埋场不同时间点(SO_2016和SO_2017)的样本共享的CRISPR spacer最多。SO样本与NEUS_2019样本之间也存在少量(约1-3%)完全相同的spacer,而CA_2019样本与其他场地的spacer重叠非常有限,这与病毒群落组成的差异相一致。
病毒辅助代谢基因
研究在所有垃圾填埋场病毒中共预测到581个独特的AMG,功能覆盖碳水化合物代谢、甲烷代谢、硫代谢、芳香化合物代谢等多个关键途径。其中一些AMG功能罕见或此前未在病毒中被报道,例如,参与有机氯化合物降解的卤代乙酸脱卤酶(DehH)、参与甲烷代谢的辅酶F420氢化酶β亚基(FrhB)、腺苷酰硫酸还原酶(AprB)以及核酮糖-1,5-二磷酸羧化酶/加氧酶大亚基(RbcL)等。这些AMG可能增强宿主在垃圾填埋场这种污染环境中的生存和代谢能力。
病毒编码的CRISPR阵列
在106,368个病毒元素中,有450个(0.42%)预测编码CRISPR阵列,这些病毒的平均长度约为47 kbp。一个长度约421 kbp的巨型噬菌体被预测编码多达6个CRISPR阵列。三个已鉴定的超巨型噬菌体(基因组大小分别为678 kbp、641 kbp和508 kbp)也编码CRISPR系统,其中两个(678 kbp和641 kbp)成为目前已知的携带CRISPR阵列的最大噬菌体基因组。
病毒编码的II类效应蛋白核酸酶
研究人员特别关注了病毒编码的紧凑型II类CRISPR-Cas效应蛋白(大小在300-800个氨基酸之间),它们是开发新型基因组编辑工具的有力候选者。通过系统发育分析,他们鉴定出许多与已知Cas12(如f2, f3, j, m亚型)和Cas14(如e, i, j, k亚型)效应蛋白相关的序列,以及一些与TnpB(Cas12的假定祖先)相关的序列。值得注意的是,发现了一些形成独立分支的潜在新型效应蛋白。
潜在的新型II类效应蛋白核酸酶
对系统发育树上独立分支的蛋白进行基序和结构分析发现,部分蛋白具有所有预期的RuvC催化基序(RuvCI, RuvCII, RuvCIII)。利用AlphaFold3进行结构预测显示,这些潜在的新型效应蛋白与已知的紧凑型Cas14j蛋白在结构上具有相似性,但又存在明显差异,表明它们可能是新型的DNA靶向系统。
研究结论与意义
本研究揭示了垃圾填埋场作为异质性污染环境,蕴藏着极其丰富且独特的病毒多样性,其病毒群落与其他生态系统重叠有限。研究发现包括迄今第三大噬菌体基因组在内的多个超巨型噬菌体,表明垃圾填埋场可能是发现这些基因组“巨人”的热点区域。病毒-宿主相互作用分析再次支持了存在跨门感染潜力病毒的观点,这与垃圾填埋场中微生物通过互养(Syntrophy)紧密互动的生态特征相符。病毒携带的AMG,特别是与有机物降解和甲烷循环相关的基因,可能显著影响宿主的代谢能力和整个生态系统的功能,这对于理解污染环境的生物修复具有重要意义。
最令人兴奋的发现之一在于病毒编码的CRISPR-Cas系统。研究不仅发现了携带多个CRISPR阵列的复杂病毒,还鉴定出大量紧凑的、可能与新型II类效应蛋白相关的基因。这些病毒来源的系统,因其小巧的尺寸和潜在的独特功能,为开发新一代基因组编辑和诊断工具提供了宝贵的候选资源,有望克服当前工具在递送和应用方面的某些限制。
综上所述,这项研究极大地拓展了我们对工程环境中病毒世界的认知,强调了垃圾填埋场作为病毒多样性研究和生物技术工具开发的宝贵资源库的重要性。未来的研究将聚焦于验证这些预测的病毒-宿主相互作用、探索新型AMG的功能,以及鉴定和工程化这些潜在的病毒来源的CRISPR系统,以期将其应用于基础研究和生物技术领域。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号