《Metabolic Engineering》:Systematic study of genomic loci in
Escherichia coli B and K12 for genomic integration: application in plasmid-free astaxanthin production
编辑推荐:
CRISPR-Cas9方法优化实现E. coli BL21和MG1655高效整合17.5-9.5kbp DNA片段,系统评估10个基因组位点发现宿主和位点选择对表达影响显著,成功构建无质粒虾青素合成菌株产率达426 mg/L。
阮玉芳-陶(Ngoc-Phuong-Thao Nguyen)| 黎昂纳德·翁(Leonard Ong)| 张从强(Congqiang Zhang)
新加坡食品与生物技术创新研究所(SIFBI),新加坡科技研究局(A*STAR),Biopolis路31号,Nanos大楼6层,新加坡138669,新加坡共和国
摘要
大肠杆菌是工业生物技术中的重要工具,但由于质粒的不稳定性,其应用受到限制。虽然基因组整合能够提供更好的稳定性,但在难以改造的B型菌株(如BL21)中整合大型DNA片段仍然具有挑战性,相比之下K12型菌株(如MG1655)则较为容易。此外,目前缺乏系统性的研究来比较B型和K12型菌株以及不同基因位点的基因表达差异。为了解决这些问题,我们首先改进了CRISPR技术,实现了在两种菌株中前所未有的整合效率:在BL21中单步插入17.5 kb片段的效率达到了40%,在MG1655中达到了100%。利用这一改进的工作流程,我们合理筛选并比较了BL21和MG1655中的10个基因位点在不同培养基下的表达情况。结果表明,宿主菌株和基因位点的选择对表达的影响比碳源或培养基组成更为关键。尽管BL21通常比MG1655具有更高的基因表达水平,但在某些位点的表达可能非常低。因此,鉴于BL21的较高变异性,我们在选择基因位点时需要更加谨慎。我们利用验证过的基因位点,将虾青素合成途径(包括多个关键基因:crtY、crtZ、crtW、crtE、crtB和crtI)无标记地整合到了BL21染色体中。最终得到的无质粒菌株在葡萄糖培养基中产生了426 mg/L的虾青素,这展示了一种在难处理宿主菌株中整合和优化复杂代谢途径的可靠方法。
引言
红色色素虾青素(3,3’-二羟基-β,β-胡萝卜素-4,4’-二酮)是类黄质中含量第二大的酮类胡萝卜素。虾青素由某些微生物自然合成,包括藻类Haematococcus pluvialis(5-10%)、酵母Xanthophyllomyces dendrorhous(0.4-0.8%)、细菌Paracoccus carotinifaciens(2%)(Elbahnaswy和Elshopakey,2024年),以及一些开花植物(Adonis aestivalis和Adonis annua)和原生动物(Aurantiochytrium属)(Zhang等人,2020年)。虾青素具有极强的抗氧化特性,其效果分别是维生素C的65倍、β-胡萝卜素的54倍和维生素E的1000倍(Olaniran等人,2023年;Schmidt等人,2011年)。虾青素具有抗肿瘤、抗炎和抗衰老的作用。目前,其主要用途是作为着色剂和水产饲料。此外,它还应用于化妆品、营养品和医疗领域(Olaniran等人,2023年;Zhang等人,2020年)。全球虾青素市场正在快速增长,预计到2030年将达到34亿美元(Ariyadasa等人,2024年)。市场上销售的虾青素通常是异构体(3S, 3’S)、(3R, 3’S)和(3R, 3’R)的混合物(Stachowiak和Szulc,2021年)。然而,对可持续和绿色虾青素的需求不断增加,促使了对其生物合成研究的增加。
虾青素的生物合成途径始于乙酰辅酶A(acetyl-CoA),经过13个连续反应生成β-胡萝卜素,随后分叉为多个复杂途径最终形成虾青素(图1)。主要挑战在于如何优雅地调控从乙酰辅酶A到虾青素的整个途径,以及平衡由羟化酶和酮醇酶催化的最终步骤。七年前,我们采用多维启发式过程(MHP)方法优化了虾青素的代谢途径。为了便于高效组合测试,我们将15个异源基因战略性地分配到4个不同的质粒(模块)中,实现了模块化途径组装、灵活的基因组合评估和故障排除(Zhang等人,2018年)。随后,通过同时发酵和提取工艺,我们获得了320 mg/L的虾青素浓度和184 mg/L/天的产量,且产物为纯度的3S, 3’S-虾青素。然而,使用质粒生产目标代谢物往往会导致大规模工业生物反应器中的性能不稳定(Rugbjerg等人,2018年)。实际上,菌株的不稳定性是将实验室成果转化为工业应用的主要障碍。为了解决这个问题,我们致力于开发一种高效的方法,将大型DNA(包括整个代谢途径)整合到染色体中。
已经开发了多种技术将DNA整合到大肠杆菌染色体中。使用T5转座酶进行随机整合(Carruthers等人,2020年)可以提高异源基因的表达效率。然而,意外插入编码序列或其调控区域可能会干扰甚至破坏天然代谢。位点特异性整合提供了更精确的控制,可以使用Tn7转座子、CRISPR转座子(Tn6677)、λ整合酶(λInt)和归巢核酸酶(I-SceI)等工具(Gutmann等人,2025年;Landy,2015年;Mitra等人,2010年;Vo等人,2021年)。然而,所有这些方法都需要预先存在的识别位点,即Tn7的attTn7、Tn6677的MmeI、λInt的attB和I-SceI的I-SceI核酸酶。多拷贝整合需要在多个基因位点构建这些识别位点,这不仅麻烦,还会增加不必要的突变概率。为了进一步提高基因组编辑的精确度,人们应用了同源重组技术来促进DNA在任意所需位置的整合。这些系统利用重组酶(如RecA或λ Red)在染色体和供体DNA之间的同源区域之间介导重组(Kuhlman和Cox,2010年)。为了提高整合效率,通常会使用抗生素抗性标记,并随后使用位点特异性重组酶(如FLP(FRT位点)或Cre(loxP位点)进行切除(Datsenko和Wanner,2000年;Fukiya等人,2004年)。然而,这种标记消除过程会在基因组中留下不必要的疤痕(FRT或loxP位点)。
相比之下,CRISPR-Cas系统可以实现无标记、无疤痕、精确且无缝的整合。尽管在大肠杆菌中操纵小到中等大小DNA片段的CRISPR策略已经取得了进展,但当前方法在处理大型DNA片段时仍面临更大挑战。例如,为了避免长DNA片段的低效整合,必须将其分割成3-4 kb的片段进行顺序整合(Li等人,2019年)。Buli及其同事利用CRISPR-Cas9和λ-Red重组酶以及可转移元件IS5成功将12 kb的DNA模块整合到了E. coli染色体中(Su等人,2020年)。虽然这种方法效率很高,但需要额外步骤来去除冗余序列和选择标记。在另一项研究中,Adrian等人使用CRISPR-Cas12a将8.4 kb的DNA片段以50%的效率整合到了lacZ位点(Jervis等人,2021年)。此外,RAGATH RNA相关DNA核酸酶被提出作为Cas9的替代方案,用于在具有挑战性的基因位点插入大型片段(高达10 kb)(Zhou等人,2025年)。值得注意的是,几乎所有这些敲入研究都使用了K12型菌株(如MG1655、BW25113和DH10B),因为这些菌株比B型菌株(如BL21)更容易进行基因改造。这是因为BL21的转化效率远低于K12型菌株(Chan等人,2013年),并且BL21缺乏Lon蛋白酶,而恢复Lon蛋白酶可以显著提高CRISPR-Cas9的工程效率(Okshevsky等人,2023年)。
在这项研究中,我们开发了一种简单的基于CRISPR的工作流程,用于在BL21和MG1655菌株中整合DNA。我们选择了10个基因位点,并评估了它们的敲入效率和蛋白质表达水平。大多数位点的整合效率很高(70-100%)。我们的方法在BL21菌株中单步插入17.5 kb片段的成功率为40%,在MG1655菌株中实现了100%的整合效率。作为概念验证应用,我们应用CRISPR方法成功构建了一种无质粒、无抗生素的大肠杆菌菌株,该菌株能够高效生产高浓度的虾青素。
章节摘录
高效的大规模DNA整合CRISPR-Cas9系统在大肠杆菌中的应用
选择整合位点不仅对实现高敲入效率和整合基因或基因操纵子的良好表达至关重要,还会影响工程菌株的代谢负担和稳定性。然而,缺乏系统性的知识使得这些决策变得困难。最近的一项研究评估了26个合理选择的位点,发现基因位点对基因表达的影响有限(最多2.6倍)。然而,某些位点表现出显著的影响
讨论
在这项研究中,我们开发了一种简单而高效的CRISPR-Cas9工作流程,用于将大型DNA片段精确且无疤痕地整合到大肠杆菌染色体中。该方法成功将14个虾青素合成途径的异源基因整合到了大肠杆菌染色体的不同位点,包括多达3-4个拷贝的瓶颈基因crtY和crtZ。我们的CRISPR-Cas9工作流程在K12型菌株MG1655和B型菌株中实现了高达9.7 kbDNA片段的近100%敲入效率
结论
当重组途径涉及大量(>10个)基因时,开发无质粒菌株可能具有挑战性。在这项研究中,我们优化了CRISPR-Cas9系统,实现了将大型DNA片段精确且无缝地整合到大肠杆菌基因组中。我们系统地分析了基因表达,并选择了适合大肠杆菌 B型和K12型菌株的几个位点,并利用这些见解构建了生产虾青素的无质粒大肠杆菌菌株。
菌株和质粒
本研究中使用的大肠杆菌菌株包括来自耶鲁大学Coli遗传资源中心(CGSC)的BL21(CGSC#12504)和MG2T7(Zhang和Shukal,2026年)。大肠杆菌 DH5a用于克隆。重组基因及其涉及类胡萝卜素生产的操纵子与之前描述的一致(Zhang等人,2018年)。四个质粒(SAR、MPPI、EBIA和YZW)受TM1启动子调控。质粒、引物和突变菌株的信息
CRediT作者贡献声明
张从强(Congqiang Zhang):撰写 – 审稿与编辑,撰写 – 原始草稿,验证,监督,资源管理,项目管理,方法学研究,资金获取,概念构思。阮玉芳-陶(Ngoc-Phuong-Thao Nguyen):撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,方法学研究,资金获取,数据分析,概念构思。黎昂纳德·翁(Leonard Ong):方法学研究,数据分析
未引用的参考文献
Jean-Paul和Haeussler,2018年。
资金来源
本研究得到了RIE2020/RIE2025 新加坡科技研究局(A*STAR)的支持,具体包括:(1) 2022年BMRC中央研究基金(CRF)的应用/转化研究(ATR, SIF-GF21-X101)和(2) 2025年中央研究基金(CRF, SIF-GF25-0370);(3) 职业发展基金(C233312033);(4) 新加坡-澳大利亚食品创新双边计划(R24I4IR001)。
致谢
我们感谢Renette Tang和Prabhakar Sah在eGFP敲入实验中的协助,以及Sudha Devi D/O Manbahal Shukal在MM01和BM01中测试番茄红素生产方面的帮助。