比较基因组学揭示了艰难梭菌噬菌体之间的多样性和分类关系

《Microbiology Spectrum》:Comparative genomics reveals diversity and taxonomic relationships among Clostridioides difficile phages

【字体: 时间:2025年11月15日 来源:Microbiology Spectrum 3.8

编辑推荐:

  艰难梭菌噬菌体基因组比较分析显示存在九个遗传集群,提出23个新属、3个新科及子科分类体系。研究发现噬菌体裂解模块具有多样性,其中 amidase_3 和 LysM 域高度保守且受 purifying selection 作用。基因家族共享度达32%,支持现有分类需修订。抗菌治疗潜力及与未培养病毒比较验证了分类的可靠性。

  在当今医疗领域,Clostridioides difficile(艰难梭菌)感染已成为一个重要的公共卫生问题。这种细菌能够引起严重的抗生素相关性腹泻、结肠炎和毒素介导的感染,尤其在使用抗生素治疗后,其孢子在肠道中复苏并引发反复感染,这对患者的健康构成重大威胁。由于抗生素耐药性的增加,寻找有效的替代疗法显得尤为迫切。在此背景下,噬菌体(phage)和其衍生蛋白,如溶菌酶(endolysin)被视作一种有潜力的解决方案。噬菌体作为病毒,能够特异性地感染并杀死目标细菌,这种特性使其在对抗艰难梭菌感染方面展现出独特的优势。然而,对噬菌体基因组和蛋白质的深入研究仍显不足,这限制了其在临床治疗中的应用。

本研究通过比较基因组学方法,对44个艰难梭菌噬菌体基因组进行了全面分析。这些基因组来源于不同的环境,包括水、污水污泥、医院、人类粪便样本和土壤等。研究采用了多种计算工具和方法,包括基于蛋白质共享的聚类分析、基因组和蛋白质组的系统发育分析、平均核苷酸身份(ANI)计算以及核心基因的识别。通过这些分析,研究团队将噬菌体基因组划分为九个主要集群,其中没有单例(singleton),这一发现与以往的噬菌体研究结果有所不同。此外,研究还提出了23个新的属、三个新的科,并将现有属提升为亚科,为艰难梭菌噬菌体的分类提供了新的框架。

研究结果显示,这些噬菌体的基因组长度差异显著,从31千碱基对(kbp)到135 kbp不等。其中,八个基因组长度超过100 kbp,而其余的则约为44 kbp。基因组的GC含量范围为26%至31%,与基因组长度之间存在高度负相关性(Pearson相关系数为-0.85383,P值为1.755e?13)。同时,基因组长度与编码序列(CDS)数量之间呈现高度正相关(Pearson相关系数为0.98511,P值为2.2e?16),而编码密度与基因组长度之间则略有负相关(Pearson相关系数为-0.36264,P值为0.01555)。这些数据表明,基因组的大小和结构在一定程度上反映了其功能和进化路径的多样性。

在对溶菌模块的分析中,研究团队识别了92种溶菌酶和47种溶菌素(holin)。溶菌酶被划分为五个不同的蛋白质家族(phams),每个家族中的溶菌酶具有相同的结构域特征。例如,pham_1、pham_32、pham_108和pham_667分别包含催化结构域amidase_3、NLPC-P60、糖胺酶(glucosaminidase)和amidase_2,而pham_12则包含细胞壁结合结构域LysM。溶菌酶的组织方式表现出多样性,包括三种溶菌酶编码在同一个基因组中、两种溶菌酶连续编码、两种溶菌酶单独编码以及单个溶菌酶的编码方式。这种多样性反映了噬菌体在适应不同宿主和环境时所采取的多种策略。

溶菌素的分析同样揭示了丰富的结构域多样性。溶菌素被划分为三个不同的蛋白质家族,其中pham_5包含特定的结构域phage_holin_5_2(PF16079),而其他两个家族未能找到显著的保守结构域。这种结构域的分布差异可能与溶菌素的功能多样性有关,表明它们在宿主裂解过程中的不同作用机制。

研究进一步探讨了溶菌酶和溶菌素编码基因的选择压力。通过Datamonkey平台进行的分析显示,这些基因主要受到纯化选择(purifying selection)的影响。对于含有amidase_3结构域的溶菌酶,92个位点在FEL、FUBAR和SLAC模型中被检测为负选择(negative selection),而MEME模型检测到5个正选择(positive selection)位点。对于含有LysM结构域的溶菌酶,FEL、FUBAR和SLAC模型共同检测到62个负选择位点,MEME模型检测到1个与FEL和FUBAR共享的正选择位点,以及27个在FEL、FUBAR和SLAC中共同发现的位点。这些结果强调了溶菌酶和溶菌素在宿主裂解过程中的关键作用,并且它们的结构域在进化过程中经历了严格的选择压力。

在比较基因组与未培养病毒数据集(IMG/VR v4)时,研究团队发现有2,790个艰难梭菌噬菌体基因组,其中297个高质量基因组被选中用于进一步分析。通过选择每个先前定义的集群中的一个代表基因组,并进行基于蛋白质组的聚类分析,研究发现285个基因组与这些代表基因组匹配,归入九个预定义的集群。此外,五种基因组形成了两个新的集群(J和K),而七种基因组则被归为单例。这些结果表明,尽管现有数据集中的噬菌体基因组数量有限,但它们在结构和功能上的多样性依然显著。vContact2的分析进一步支持了这一结论,显示所有艰难梭菌噬菌体形成了独特的病毒集群(VCs),而单例基因组则作为异常值出现。

值得注意的是,研究团队在分析中发现了一些与其它噬菌体不同的现象。例如,三个基因组(IMGVR_UViG_2671180842_000004、IMGVR_UViG_2848092901_000003和IMGVR_UViG_2859501880_000003)与Streptococcus噬菌体Javan630(MK448997)形成了聚类,而另一个单例基因组(IMGVR_UViG_2938479101_000001)则与感染革兰氏阴性菌的噬菌体形成聚类。这表明,尽管艰难梭菌噬菌体主要与革兰氏阳性菌相关,但它们的基因组中可能存在一些与革兰氏阴性菌噬菌体相似的特征,这为未来研究提供了新的方向。

本研究的发现对噬菌体疗法的发展具有重要意义。通过揭示噬菌体基因组的多样性、分类系统的更新以及溶菌模块的结构域特征,研究为未来噬菌体的筛选、分类和应用提供了理论基础。此外,提出的新的分类方案有助于更准确地识别和分类新分离的噬菌体基因组,从而推动噬菌体疗法的标准化和应用。然而,研究也指出了当前数据集的局限性,即基因组数量有限可能无法全面反映噬菌体在不同环境中的多样性。因此,未来的研究需要更广泛的数据集和更深入的分析,以进一步探索噬菌体的生物学特性和潜在的治疗价值。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号