《Journal of Oral Microbiology》:CRISPR spacer profiling and prophage mining reveal diverse bacteriophages associated with Streptococcus Mutans
编辑推荐:
背景 变异链球菌(Streptococcus mutans)是关键的致龋菌。现有抗菌策略缺乏物种特异性,而基于噬菌体的干预方法仍处于实验阶段,并且需要分离获得更多变异链球菌噬菌体菌株。
目的 对与变异链球菌相关的噬菌体多样性以及菌株水平噬菌体暴露的异质性进行
背景 变异链球菌(Streptococcus mutans)是关键的致龋菌。现有抗菌策略缺乏物种特异性,而基于噬菌体的干预方法仍处于实验阶段,并且需要分离获得更多变异链球菌噬菌体菌株。
目的 对与变异链球菌相关的噬菌体多样性以及菌株水平噬菌体暴露的异质性进行描绘,方法是基于基因组信息开展CRISPR间隔序列与前噬菌体分析。
材料与方法 研究人员汇编了944个公开可得的变异链球菌基因组,并去冗余得到735株非冗余菌株。随后对CRISPR-Cas系统、间隔序列、间隔序列靶标以及推定前噬菌体进行鉴定、质量评估与功能注释。采用terminase large subunit protein(TerL)评估(前)噬菌体的系统发育关系,并通过比较基因组学比较携带噬菌体靶向间隔序列的菌株与不携带此类间隔序列的菌株。
结果 在735株菌株中,有548株检测到CRISPR系统,共获得14,263条间隔序列,其中1,864条噬菌体靶向间隔序列可映射至110个病毒基因组,包括41个培养分离株、51个宏基因组组装噬菌体以及18个未培养病毒基因组。被最频繁靶向的培养噬菌体为phiKSM96,而宏基因组组装的Caudoviricetes ctNo011表现出更广泛的靶向范围。前噬菌体挖掘在130株菌株中鉴定出186个区域,其中37个达到中等质量及以上,并发现了与ctNo011和phiKSM96相关的元件。TerL系统发育分析显示,大多数高质量内源性前噬菌体与phiKSM96和ctNo011聚类。
结论 这些发现揭示了一个庞大的、尚未培养的、以变异链球菌为靶标的噬菌体库,并为未来分离新型噬菌体以用于龋病预防提供了关键的基因组学路线图。
该研究发表于《Journal of Oral Microbiology》,围绕口腔致龋核心菌变异链球菌(Streptococcus mutans)的相关噬菌体资源匮乏这一关键瓶颈展开。龋病是全球高负担的慢性感染性疾病,当前龋病控制虽可依赖机械去除菌斑、饮食干预以及氟化物、氯己定等化学手段,但这些策略普遍缺乏物种特异性,往往在抑制变异链球菌的同时破坏口腔共生微生物群落稳态。噬菌体治疗因其理论上的宿主特异性而成为精准防龋的重要候选方向,但变异链球菌噬菌体分离极为有限,已被分离并完成测序的仅有少数几株,这严重制约了后续鸡尾酒疗法设计、宿主范围评估以及临床转化。因此,有必要系统刻画变异链球菌相关噬菌体的真实多样性,并理解不同菌株在历史噬菌体暴露与基因组整合层面的异质性。
在此背景下,研究人员以大规模公共基因组数据为基础,试图从两个互补维度重建变异链球菌与噬菌体之间的历史互作图景:其一,利用CRISPR-Cas系统中的间隔序列(spacer)作为既往外源核酸入侵的“分子记忆”,反向追踪可感染该菌的噬菌体谱系;其二,通过前噬菌体(prophage)预测识别整合于宿主染色体中的温和噬菌体成分,以揭示内源性噬菌体储备及其功能载荷。研究的总体结论表明,变异链球菌相关噬菌体远比当前培养分离结果所显示的更为丰富,且大量与其互作的病毒谱系仍处于“未培养”状态;其中,ctNo011与phiKSM96相关谱系尤其值得优先关注,为未来靶向分离新型防龋噬菌体提供了基因组导航框架。
方法概括:研究人员整合944个公开变异链球菌基因组,按平均核苷酸一致性(ANI)去冗余后保留735株非冗余菌株,样本来源包括Shields实验室数据集、HOMD、NCBI及既往发表队列。采用Snippy与IQ-TREE构建核心基因组SNP系统发育树;利用CRISPRCasTyper鉴定CRISPR-Cas系统并提取spacer,随后以BLASTn比对NCBI RefSeq、CHVD、IMG/VR与ICEberg数据库以识别靶标;使用VIBRANT与CheckV预测并评估前噬菌体;结合dbCAN3、VFDB、CARD、PADLOC、dbAPIS、VOG与Pfam-A开展功能注释;以TerL蛋白构建噬菌体/前噬菌体系统发育树,并采用Bakta、eggNOG-mapper和ClusterProfiler进行比较基因组学与功能富集分析。
CRISPR-Cas systems are widespread in S. mutans
研究人员首先对735株非冗余变异链球菌进行CRISPR-Cas系统普查,发现548株携带潜在CRISPR系统,提示该菌普遍存在适应性抗病毒免疫装置。就系统数量而言,257株仅含1套CRISPR系统,218株含2套,73株含3至7套,说明不同菌株在免疫结构复杂度上存在明显差异。基于分型结果,II-A型最常见,约占37%,其后为I-C、I-E与II-C型。进一步分析显示,CRISPR阳性菌株的spacer数量高度异质,每个基因组为1至130条不等,中位数为21.1;I-C型平均spacer数最高,II-C型最低,而不同亚型间spacer长度差异不大。该部分结果说明,变异链球菌在种内层面具有显著不同的CRISPR免疫积累模式,但这种差异与基于核心SNP的系统发育关系并未呈现清晰对应。
The original derivation of CRISPR spacers
为了追踪塑造该菌免疫记忆的外源遗传压力,研究人员对14,263条spacer进行了系统靶标比对。结果显示,仅3,741条spacer能够获得显著匹配,约占总数的26.23%,其余大部分来源仍未知,提示存在庞大的“病毒暗物质”。在所有匹配事件中,噬菌体与细菌基因组元件是主要来源,其中1,553条spacer匹配到92个噬菌体。值得注意的是,已知5株已分离的变异链球菌噬菌体均位于高频靶标之列,表明spacer追踪策略能够有效回溯真实宿主-噬菌体互作历史。培养噬菌体中,phiKSM96被562条spacer、285株菌株靶向,是最常见的对象;而宏基因组组装噬菌体Caudoviricetes ctNo011则被567条spacer、309株菌株靶向,覆盖范围甚至超过phiKSM96,提示其可能是口腔环境中高度流行的重要谱系。研究还从IMG/VR数据库进一步识别到18个高可信度未培养Streptococcus相关病毒基因组,其中部分被明确预测可感染变异链球菌。比较基因组学分析表明,带有噬菌体特异spacer的菌株与不带此类spacer的菌株在基因组成上存在差异,不同噬菌体靶向亚群也呈现有限但可辨识的特异基因集合,说明历史噬菌体暴露与宿主基因组组成之间存在关联。
The prediction of prophages and their function in S. mutans
在前噬菌体层面,研究人员于735株基因组中共鉴定出186个推定前噬菌体区域,分布于130株菌株,整体检出率为17.7%。大多数阳性菌株仅携带1个前噬菌体,但也有少数菌株含多个整合区域。经CheckV质量评估后,仅少部分达到完整或高质量水平,绝大多数属于低质量或未定级片段,表明变异链球菌基因组中广泛存在衰减或残留型前噬菌体成分。分类比对显示,47个前噬菌体区域可归属于已知类群,其中16个与ctNo011相关,7个与phiKSM96相关,另有部分与葡萄球菌噬菌体及其他链球菌相关噬菌体相似。功能注释进一步揭示,这些前噬菌体携带丰富的功能模块,包括碳水化合物活性酶(CAZy)、毒力因子、抗菌药物耐受相关注释、宿主防御系统与抗防御系统,以及完整的噬菌体生命周期核心模块,如结构组装、DNA包装、复制、整合/溶原性与裂解相关蛋白。这说明前噬菌体不仅是整合遗传元件,也可能是宿主适应性状与基因组可塑性的重要来源。
Phylogenetic analysis of S. mutans reveals correlations between CRISPR-Cas systems, phage targeting, and prophage carriage
将CRISPR特征与前噬菌体信息映射到核心基因组系统发育树后,研究人员发现CRISPR阵列数与spacer数、被靶向噬菌体数之间均呈显著正相关,spacer数与靶向噬菌体数之间亦呈强正相关,说明免疫阵列越复杂、记忆越丰富的菌株,通常具有更广的历史噬菌体接触谱。携带多亚型CRISPR-Cas组合系统的菌株,其阵列数和靶向噬菌体范围均显著高于仅携带单一亚型者,提示复合免疫架构可能增强抗病毒适应能力。针对不同噬菌体的spacer来源分析还显示,CRISPR亚型构成并非恒定:某些噬菌体更常由II-A型系统记录,而另一些则伴随I-E或I-C型贡献上升,说明不同CRISPR亚型在面对不同病毒谱系时可能具有差异化参与模式。相较之下,前噬菌体是否存在及其完整性与CRISPR阵列数、spacer数并无显著相关,提示当前宿主CRISPR状态并不足以解释前噬菌体整合格局。
Phylogenetic relationships of S. mutans phages and prophages
基于TerL蛋白构建的最大似然树进一步揭示了噬菌体与前噬菌体之间的演化关联。大多数高质量变异链球菌内源性前噬菌体集中于一个富前噬菌体主分支,该分支同时包含phiKSM96、ctNo011及部分IMG/VR未培养病毒基因组,提示这些元件共享相近的温和噬菌体演化背景。与之相对,ctQS92与既往已分离的smHBZ8、APCM01、M102和M102AD聚为另一独立分支,而该分支中的前噬菌体代表较少。功能模块比较支持这种二分格局:富前噬菌体分支普遍保留典型Caudoviricetes温和噬菌体的结构模块及位点特异性整合酶,而已分离噬菌体分支缺乏与该类头部结构相关的同源模块。该结果提示,目前培养分离成功的噬菌体仅覆盖了变异链球菌相关病毒多样性的一部分,尚有大量未培养谱系有待开发。
讨论与结论
论文讨论部分强调,单靠现有已分离的少数噬菌体远不足以支撑针对变异链球菌的精准噬菌体干预设计。本研究通过整合CRISPR spacer推断与前噬菌体挖掘,构建了迄今规模最大的变异链球菌噬菌体互作基因组图谱,证明大量可与该菌发生互作的病毒谱系尚未被培养获得。研究特别指出,phiKSM96此前已被证明具有较宽宿主范围,而本研究进一步显示ctNo011的宿主覆盖面可能更广,并且具有整合酶等温和噬菌体特征,因此是后续优先分离与体外宿主谱验证的重要候选对象。另一方面,多数前噬菌体属于低质量残留元件,更可能作为宿主遗传储备而非可直接诱导产生完整病毒颗粒的活跃前噬菌体。研究同时指出,受限于二代测序对重复区解析能力不足,以及公共数据库中已知噬菌体序列有限,仍有大比例spacer无法溯源,未来需依赖长读长测序和更完善的病毒数据库继续完善该领域认知。
研究结论部分可译为:这些发现揭示了一个庞大的、尚未培养的、以变异链球菌为靶标的噬菌体库,并为未来分离新型噬菌体以用于龋病预防提供了关键的基因组学路线图。