《Applied and Environmental Microbiology》:Occurrence and applications of CRISPR-Cas systems in bifidobacteria
编辑推荐:
本综述系统梳理了CRISPR-Cas系统在双歧杆菌中的分布规律,并重点评述了基于内源与外源CRISPR-Cas系统的基因组编辑工具的开发与应用现状。文章深入探讨了双歧杆菌基因编辑面临的关键挑战(如低转化效率、菌株差异性),并展望了大型基因片段插入、原位编辑等未来研究方向,为开发下一代益生菌提供了重要技术路径与理论支撑。
双歧杆菌是人类肠道微生物群中的关键成员,许多菌株因其促进健康的特性而被广泛用作益生菌。尽管关注度日益增长,但由于缺乏可用的基因组编辑工具,双歧杆菌的遗传学研究相对有限。基因组学和CRISPR-Cas系统的最新进展为在该属中进行靶向基因组修饰提供了机遇。
双歧杆菌中CRISPR-Cas系统的存在与分布
随着测序技术的持续发展,产生了大量的基因组序列,并建立了全面的细菌基因组数据库。同时,计算生物学和生物信息学的进步使得分析和解读多样化的细菌基因组成为可能。值得注意的是,几种以CRISPR为中心的流程和计算工具已经出现,用于确定CRISPR-Cas系统在细菌中的存在、分布和组成。
迄今为止,根据Cas蛋白的结构和功能,CRISPR-Cas系统被分为2个主要类别、7种类型和46种不同的亚型。本研究将分析范围大幅扩展(十年内超过100倍),使用CRISPRCasTyper版本1.8.0分析了截至2025年2月通过NCBI可获得的总共6,657个双歧杆菌基因组。
总体而言,在分析的6,657个菌株中,有3,050个基因组编码了CRISPR-Cas系统,其中133个编码了多个系统。这些CRISPR-Cas系统分布在110个物种中的83个(75.5%),这些物种至少拥有一个CRISPR-Cas系统。其中,长双歧杆菌拥有最多编码CRISPR-Cas系统的菌株(714个),出现率为36%。在分析菌株数超过10个的物种中,动物双歧杆菌的出现率最高,达89.3%。总体而言,并且与细菌中的普遍趋势一致,I型是最主要的CRISPR-Cas类型(85.3%),其中I-C型系统存在的菌株数量最多,而I-E型则在最多的物种中被发现。
与最近一项关于双歧杆菌中CRISPR-Cas系统全面挖掘的研究相比,新的扩展分析能够识别出35个拥有CRISPR-Cas系统的新物种。此外,我们还能够在双歧杆菌中识别出新的亚型,包括II-D型、III-A型、III-D型和V-A型。
总体而言,CRISPR-Cas系统的存在并非严格依赖于物种;然而,某些拥有大量测序基因组的物种确实显示出特定亚型的优势。例如,I-G型在动物双歧杆菌中占主导地位,而I-C型在短双歧杆菌中占主导地位。I型系统在双歧杆菌中的广泛分布表明,它们是最成熟的,并且可能是重新用于内源CRISPR-Cas基因组编辑的最佳候选者。
双歧杆菌中基于CRISPR的基因组编辑工具
在过去的十年中,基于CRISPR-Cas的基因组编辑工具在各种生物体中得到了快速发展。然而,由于双歧杆菌的顽固特性,大多数研究集中在其他乳酸菌上,主要是乳杆菌属。在这些物种中,多种外源CRISPR-Cas系统已被利用。另一方面,只有有限数量的研究成功使用CRISPR-Cas系统编辑了双歧杆菌。
尽管内源和外源CRISPR-Cas系统的设计和使用可能存在差异,但整体编辑机制是相同的。向导RNA将Cas效应蛋白引导至基因组中互补的靶位点,引入DNA损伤。设计在靶位点上下游的同源重组编辑模板促进了同源重组,从而产生预期的编辑。
内源CRISPR编辑
考虑到CRISPR-Cas系统在双歧杆菌中的广泛分布,利用内源CRISPR-Cas系统比引入外源Cas效应蛋白具有实际优势。引入可携带的Cas效应蛋白可能因其固有的细胞毒性而变得困难。此外,由于它只需要一个包含与目标基因互补的自靶向间隔子的迷你CRISPR阵列和一个编辑模板,其较小的尺寸能够增强质粒的递送。
由于这些优势,首次CRISPR-Cas编辑是通过表征并重新利用动物双歧杆菌乳亚种中的内源I-G型CRISPR-Cas系统实现的。随后,一项研究通过重新利用短双歧杆菌中的内源I-C型CRISPR-Cas系统,成功删除了尿嘧啶磷酸核糖基转移酶基因的整个编码序列。
外源CRISPR编辑
尽管重新利用内源CRISPR-Cas系统具有显著优势,但根据我们的分析,超过一半的基因组不编码CRISPR-Cas系统。在这种情况下,一个可行的策略是引入外源CRISPR-Cas系统。虽然I类CRISPR-Cas系统最为普遍且通常表现出较低的毒性,但它们需要多蛋白复合物(例如用于切割的CRISPR相关抗病毒防御复合物)进行切割,这使得其工程化递送更具挑战性。另一方面,II类系统编码用于切割的单亚基效应蛋白,因此更常被外源使用。
用于DNA编辑的常用标志性蛋白分别是II型系统的Cas9和V型系统的Cas12。为了说明外源CRISPR-Cas系统的潜力,Li等人能够利用Cas9蛋白获得编码尿嘧啶磷酸核糖基转移酶的基因0348和0208的纯合突变敲除。
碱基编辑
上述两种方法会产生DNA双链断裂,并需要带有同源臂的模板进行同源重组。基于DNA双链断裂的基因组编辑方法更容易出错,并可能导致不想要的插入或缺失。此外,长的编辑模板不仅因其尺寸而降低转化效率,而且编辑模板的长度也会影响整体编辑效率,使得难以开发统一、高效的编辑工具。相比之下,碱基编辑器有潜力通过放弃形成DNA双链断裂和需要编辑模板来克服这些挑战。
碱基编辑器将催化受损的CRISPR-Cas9突变体(dCas9或nCas9)与DNA脱氨酶融合。基于所使用的脱氨酶,已经开发出两种类型的碱基编辑器:胞嘧啶碱基编辑器(CBE)和腺嘌呤碱基编辑器(ABE)。
迄今为止,只有CBE被应用于双歧杆菌。最初,Pan等人使用CBE在tetW编码序列中引入提前终止密码子,导致抗性表型丧失。随后,Lin等人通过使用带有UGI接头的CBE进一步开发了碱基编辑器,这提高了碱基编辑效率。
尽管有这些进展,碱基编辑器在双歧杆菌中仍然存在一些固有的局限性。脱靶效应可能发生在编辑窗口内,并且在引入提前终止密码子时,只有特定的密码子可以转化为终止密码子,这限制了编辑可以在何处进行。另一个限制编辑在基因组中位置的因素是前间区序列邻近基序序列要求。
双歧杆菌基因组编辑的挑战与机遇
低转化效率
双歧杆菌缺乏标准化、经过验证的分子部件,如启动子、终止子和报告基因,以及广泛兼容的质粒骨架,这限制了对不同物种的可预测工程化操作。在操作上,实现双歧杆菌编辑的初始且最基本的步骤是将遗传物质转入细胞。然而,这一过程受到双歧杆菌顽固性质的挑战,包括其难以穿透的细胞壁、丰富的限制修饰系统、有限的分子工具、质粒骨架和转化方案,导致转化效率相对较低,且工具仅适用于有限范围的物种。
双歧杆菌的多层复杂细胞壁是基因递送的主要障碍,因为双歧杆菌中最常见的转化方法是电穿孔。电穿孔的效率取决于细胞壁的结构和密度。除了通过化学处理削弱细胞壁结构外,最近的工作表明转化效率也受关键 competence 基因表达水平的影响。
转化过程中的另一个显著障碍是双歧杆菌中大量存在的R-M系统。R-M系统通过识别未甲基化的短DNA序列并切割它们,起到抵抗外源DNA的屏障作用。R-M系统对转化的重要性已在长双歧杆菌长亚种NCIMB 8809中得到证明,其中限制性内切酶基因的敲除导致转化效率显著提高。
为了规避R-M系统带来的挑战,已经开发出两种主要策略。第一种策略是在将质粒引入细菌之前对其进行甲基化。第二种策略是通过改变核苷酸序列为替代的同义密码子来移除R-M识别位点,从而构建R-M不敏感载体。
虽然应用较少,但接合为递送遗传物质提供了一种替代方法,具有不同于电穿孔的独特优势。
菌株变异性
尽管最近通过解决R-M系统和细胞壁结构等障碍来提高转化效率的努力取得进展,但大多数解决方案都是菌株特异性的,没有适用于整个双歧杆菌属的通用方案。由于基因组和表观基因组水平的变异性,转化条件必须针对特定菌株进行定制。
这些发现表明,虽然导致双歧杆菌低转化效率的因素已得到更好的理解并可以克服,但开发的质粒和方案在很大程度上仍然是菌株特异性的。展望未来,除了从质粒中移除R-M motif或对质粒进行甲基化外,转化方案中的参数,包括培养基组成、质粒量和电穿孔条件,都需要针对目标菌株进行定制。
大片段插入
双歧杆菌中基于CRISPR-Cas的基因组编辑已经实现了基因删除、碱基编辑和短片段插入。然而,超过三个终止密码子的插入尚未实现。插入编码整个代谢操纵子、生物合成簇甚至整个CRISPR-Cas系统的数千碱基长的序列,可能为双歧杆菌的应用开辟新的机遇。
尽管尚未有在双歧杆菌中成功进行大片段插入的报道,但几项研究已证明在其他生物体中成功实现。CRISPR相关转座酶(CASTs/CasTn)是可编程的、RNA引导的DNA插入系统,它结合了CRISPR-Cas效应蛋白和转座酶,以介导位点特异性整合,不依赖于同源重组和DNA双链断裂。
另一种不依赖于同源重组和DNA双链断裂的可编程大片段插入方法依赖于大丝氨酸重组酶(LSRs)。LSRs是位点特异性DNA重组酶,指导可移动遗传元件整合到细菌基因组中。
群落编辑
在群落背景下编辑细菌基因组的能力为科学发现和微生物组工程应用的扩展提供了新的机遇,以操纵细菌群体的组成和功能。具体来说,在肠道内编辑双歧杆菌可以为了解其在微生物组群落中的作用提供宝贵的见解。
群落编辑的主要挑战是高效的DNA递送和靶向诱变。迄今为止,尚未在双歧杆菌中进行相关研究,但已有努力开发生物环境下的编辑工具。然而,基于接合的递送方法不允许物种特异性递送。噬菌体递送利用噬菌体的天然宿主特异性,被提出作为提高DNA递送特异性的一种可能解决方案。
结论与未来展望
基于CRISPR-Cas系统的工程工具在双歧杆菌中的应用仍处于起步阶段。考虑到菌株变异性和这些物种中CRISPR-Cas系统的丰富性,需要更广泛地表征和开发内源CRISPR-Cas编辑工具。同时,推进外源CRISPR-Cas编辑工具将需要从密切相关的物种中识别新的Cas效应蛋白,并进行结构导向的诱变以提高其编辑效率。这些进展也将为扩展基于CRISPR的基因组编辑工具箱奠定基础。
除了基因组编辑,CRISPR干扰/激活(CRISPRi/CRISPRa)可用于操纵特定目标基因的表达。除了转录组控制,CRISPR-Cas工具还可用于探索和重塑表观遗传景观。
在阐明重要代谢途径和相关基因功能后,长期目标将是利用CRISPR编辑工具来改造菌株,以增强功能或优化性能。CRISPR-Cas技术的持续发展对于充分释放双歧杆菌菌株作为基因增强益生菌的潜力至关重要。