Cas1-2/3整合酶捕获、递送和整合外源DNA至CRISPR基因座的机制解析
【字体:
大
中
小
】
时间:2025年10月12日
来源:Structure 4.3
编辑推荐:
本研究通过冷冻电镜技术解析了铜绿假单胞菌I-F型CRISPR-Cas系统中Cas1-2/3整合酶的多构象状态结构,揭示了该整合酶通过正电荷通道捕获外源DNA片段,并通过变构调节暴露新的DNA结合位点,阐明了原间隔序列整合至CRISPR阵列的分子机制,为理解原核生物适应性免疫的分子基础提供了重要见解。
在微生物与病毒持续演化的军备竞赛中,原核生物发展出了独特的适应性免疫系统——CRISPR-Cas。这一系统使细菌和古菌能够"记住"曾经感染过的病毒,并在再次遭遇时快速启动防御。然而,这一免疫记忆是如何形成的?外源DNA片段是如何被精准地整合到细菌基因组的CRISPR阵列中的?这些基本问题的分子机制一直困扰着科学家。
在CRISPR-Cas适应性免疫的过程中,Cas1和Cas2蛋白是形成免疫记忆的核心组件。它们组成的整合酶复合物负责捕获外源DNA片段(称为原间隔序列)并将其插入CRISPR阵列。有趣的是,在I-F型CRISPR-Cas系统中,Cas2与Cas3蛋白天然融合,形成Cas2/3融合蛋白,但这种融合的功能意义及其对整合过程的影响尚不明确。
发表在《Structure》杂志上的这项研究,由William S. Henriques等科学家完成,他们通过冷冻电镜技术解析了铜绿假单胞菌Cas1-2/3整合酶的多个结构状态,从分子水平揭示了这一整合酶如何捕获、运输并精确整合外源DNA至CRISPR基因座的全过程。
研究团队主要运用了冷冻电子显微镜技术解析蛋白质结构,包括铜绿假单胞菌Cas1-2/3复合物的表达纯化、与不同DNA底物的复合物制备、冷冻样品制备和多数据集收集。通过单颗粒分析技术处理高分辨率图像,结合AlphaFold3结构预测进行模型构建和优化。同时采用生物化学方法分析DNA-蛋白质相互作用,包括尺寸排阻色谱分析复合物组成和体外整合活性测定。研究还进行了系统发育分析和序列保守性评估,以验证结构观察到的功能位点的进化重要性。
研究人员首先解析了无核酸结合的Cas1-2/3复合物的高分辨率结构(3.3 ?)。该复合物形成四叶螺旋桨状的异源六聚体结构,由四个Cas1亚基和两个Cas2/3亚基组成。结构分析发现,复合物的一个面上有一个明显的带正电荷的通道,宽24 ?,长75 ?,可容纳22个碱基对的B型DNA。这个通道被命名为"外源DNA结合面",其边缘由Cas2的四个残基(K11、R18、T93和C94)组成,负责与双链DNA的磷酸骨架形成氢键。Cas1中的组氨酸残基(H25)像楔子一样位于通道两端,可分裂双链DNA并将3'单链DNA末端导向Cas1活性位点。
Cas3是一个组氨酸/天冬氨酸(HD)核酸酶和超家族2(SF2)解旋酶,在I型CRISPR干扰过程中降解目标外源DNA。结构显示,RecA1结构域中的一个环状插入(残基483-511)像关闭的门一样覆盖着HD核酸酶活性位点。HD结构域的R148和K127与G498和E500形成氢键,将门闩固定在HD活性位点上。当Cas2/3与Cascade复合物结合时,单链R环会置换门闩,使门打开,创造一条通往HD活性位点的直接路径。这种自抑制机制可能有助于防止Cas3的脱靶DNA降解。
研究表明,Cas2对于在I-F型系统中弯曲CRISPR前导链至关重要,残基R55和N56是这一相互作用的关键。在无DNA状态下,Cas2的"前导链结合位点"被Cas2(R54、R55、K50和E71)与Cas3的RecA1结构域(N373、D472、D473、T517、E519、D520、R525和R529)之间的氢键和盐桥网络所掩盖。这些相互作用将Cas3稳定在Cas2的前导链识别位点上。
与外源DNA结合的Cas1-2/3复合物的构象与无DNA状态相比发生显著变化。研究人员将Cas1-2/3与32bp的外源DNA片段(包含22bp双链DNA和5nt单链末端,以及一个链上的额外3'GG PAM核苷酸)孵育,解析了DNA结合状态的结构(3.31 ?)。DNA结合触发了构象变化,暴露出三个参与整合的额外DNA结合位点。Cas2和Cas3之间的连接区域(残基95-104)变得刚性化、延伸并旋转,重新定位Cas3。这一重排打破了之前Cas3与Cas1同源二聚体和Cas2的所有相互作用,并在单个Cas1同源二聚体上建立了新的相互作用。
新的Cas3位置在Cas3和Cas1之间创造了一个35 ?宽的带正电荷通道,暴露了Cas2同源二聚体两侧的CRISPR前导链结合位点。每个Cas1二聚体向外旋转并向下移动,打开了一个26 ?宽的带正电荷通道,基于先前工作命名为"CRISPR重复序列通道"。Cas2同源二聚体形成该通道的底部。活性Cas1亚基的转酯化位点在CRISPR重复序列通道的两端相距100 ?,而非活性Cas1亚基形成通道的壁。
尽管暴露出三个额外的带正电荷DNA结合位点,但仅在外源DNA结合面观察到核酸密度。22个碱基对的双链DNA通过Cas2的K11和R18与磷酸骨架形成氢键,定位在外源DNA结合通道中。H25楔子分裂双链核酸,并将3'链导向带正电荷的通道,通向Cas1活性位点进行转酯化。这种定位通过Cas2/3的T93和C94与外源DNA形成的氢键进一步稳定。
外源DNA底物在一端包含额外的3'GG二核苷酸PAM。PAM对于将外源DNA定向插入CRISPR阵列至关重要,但原间隔序列相邻基序必须在DNA整合之前或期间被去除。然而,Cas3在Cas1-2/3复合物中的位置排除了它在PAM修剪中的作用,除非发生额外的构象变化。DNA诱导的结构重排暴露了Cas1和Cas2的面,这些面在其他CRISPR系统中已被证明与PAM修剪核酸酶相互作用。
Cas1-2/3整合酶是一个C2对称的异源六聚体。这种对称整合酶必须以不对称的方向归巢到CRISPR前导序列,确保间隔序列以特定方向整合到CRISPR阵列中。为了解PAM是否起到定向整合酶到CRISPR阵列的作用,研究人员解析了Cas1-2/3将含PAM和不含PAM的外源DNA整合到CRISPR阵列的结构。
在所有结构中,Cas1-2/3与CRISPR前导序列结合,形成U形弯曲覆盖在结合于复合物外源DNA面的外源DNA上。较短的的外源DNA片段结合到Cas1-2/3的外源DNA结合面,而没有证据表明较长的CRISPR前导序列片段结合在此位置,这为Cas1-2/3在外源DNA结合面上具有长度偏好提供了结构确认。
PAM的存在引入了两个显著差异:首先,由于相应的Cas1二聚体的稳定,第二个转酯化反应位点(位点2)在PAM存在下被解析;其次,当PAM存在时,重复序列未能完全延伸通过重复序列通道。在没有PAM的情况下,重复序列穿过重复序列通道延伸到第二个转酯化位点。当重复序列通道完全被占据时,容纳第二个转酯化位点的Cas1二聚体似乎稳定,同时之前未解析的Cas3b结构域也变得稳定。
为了使第二个转酯化反应发生,Cas1-2/3复合物必须将第一个Cas1转酯化位点对接在前导序列-重复序列连接处(位点1),将第二个Cas1转酯化位点(位点2)对接在间隔序列-重复序列连接处。为了确保重复序列在新整合的外源DNA两侧完全复制,前导序列-重复序列连接处和间隔序列-重复序列连接处必须正确定位在Cas1转酯化位点中。
AlphaFold3预测显示,28bp的重复序列采用线性B型构象,比从位点1到位点2的距离短约7 ?,表明重复序列在整合过程中必须被拉长。对唯一包含完整重复序列通道密度的类别进行分析发现,重复序列在离开第一个转酯化位点后,采用伪B型螺旋构象约25 ?(约6-7bp)。密度的一个扭结标志着扭曲区域的开始,其中B型DNA的螺旋螺距弯曲进入通道的狭窄中心区域。第二个扭结标志着向伪B型DNA的过渡,因为重复序列接近位点2。这两个扭结改变了CRISPR重复序列在重复序列通道中的轨迹,使DNA在Cas2二聚体顶部弯曲约28°。重复序列的扭曲还引入了约3°的向第二个转酯化位点的偏移。
值得注意的是,排列在CRISPR重复序列通道中的带正电荷残基在I-F型系统中是保守的。对2,804个I-F型重复序列的分析表明,28bp的I-F型重复序列是保守的,包括位于反向重复序列中的四个嘌呤-嘧啶步骤。在重复通道中观察到的DNA扭曲位置与这些保守的嘌呤-嘧啶步骤很好地对应,这些步骤特别容易发生DNA扭结。
这项研究通过解析Cas1-2/3整合酶的七个结构状态,系统揭示了CRISPR适应性免疫中整合酶的自抑制和变构激活调节机制。研究发现Cas1-2/3形成一个带有正电荷面的异源六聚体复合物,用于捕获短外源DNA片段。在这种DNA捕获状态下,Cas3的HD结构域被RecA1结构域的一个环所阻断。与短DNA片段结合触发构象重排,暴露出额外的DNA相互作用位点。外源DNA通过顺序的Cas1介导的转酯化反应完全整合到CRISPR阵列中仅在没有PAM的情况下发生。在完全整合过程中,CRISPR重复序列通道扭曲B型重复序列,将重复DNA引导到第二个转酯化位点。
这些结构发现确定了CRISPR适应过程中的一个关键结构检查点。Cas3阻断Cas2与折叠的CRISPR前导序列的结合。外源DNA结合后,Cas3被置换,暴露出Cas2两侧的两个CRISPR前导序列结合位点。这一观察表明,整合酶识别特定基因组结构是CRISPR适应的一个保守特征。研究显示,外源DNA变构调节Cas1-2/3整合酶的构象,并且足以暴露引导整合酶归巢到CRISPR所必需的DNA结合位点。
研究还揭示了Cas3在调节I-F系统中新序列获取中的直接结构作用。Cas3直接控制对I-F型整合酶关键DNA结合位点的访问。AlphaFold3预测表明,Cas3和Cas1可能共同作用调节其他I型CRISPR系统中的适应过程,这为理解Cas3与整合酶在I型CRISPR系统中的功能和物理联系指明了未来研究方向。
这项工作不仅深化了我们对CRISPR-Cas系统分子机制的理解,也为利用这些系统进行基因组编辑和生物技术应用提供了重要的结构基础。对DNA捕获、整合酶激活和序列特异性整合机制的阐明,可能启发新的基因操作工具的开发,并推动基于CRISPR的诊疗策略的创新。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号