工程化重组酶实现人类基因组特定位点大片段DNA高效精准插入

《Nature Biotechnology》:Site-specific DNA insertion into the human genome with engineered recombinases

【字体: 时间:2025年11月07日 来源:Nature Biotechnology 41.7

编辑推荐:

  研究人员针对大丝氨酸重组酶(LSR)体内应用存在的低效率和高脱靶活性问题,通过定向进化、结构分析与计算模型联合优化,开发出superDn29-dCas9等变体,实现在内源性人类基因位点高达53%的整合效率和97%的全基因组特异性,成功在非分裂细胞、干细胞和原代T细胞中稳定表达长达12 kb的大片段DNA cargo,为基因和细胞疗法提供了高效精准的单步基因组插入工具。

  
基因治疗和合成生物学领域长期面临一个关键挑战:如何高效、精准地将大片段DNA序列插入人类基因组的特定位置。传统方法如病毒载体整合存在随机性高、容量有限的问题,而CRISPR-Cas系统虽然精准,但大片段插入效率低且依赖双链断裂修复机制,可能引发基因组不稳定。理想方案是在无需预装“着陆垫”(landing pad)的情况下,实现单步、特定位点、多kb级DNA的无缝整合。
大丝氨酸重组酶(Large Serine Recombinases, LSRs)是一类新兴的基因组编辑工具,其通过同时切割四条DNA链形成共价蛋白-DNA中间体,再通过亚基旋转实现链交换,可介导直接、位点特异性的基因组整合。然而,天然LSR在人类细胞中整合效率低、脱靶活性高,且严格依赖其天然识别序列(attP/attB),极大限制了其应用。
在这项发表于《Nature Biotechnology》的研究中,Arc Institute的Alison Fanton等研究人员提出了一种多策略联合的工程化方案,成功优化了LSR的效率与特异性。他们以具有良好特性谱的Dn29 LSR为概念验证,通过深度扫描诱变、定向进化、机器学习引导的突变叠加、dCas9融合及供体DNA attachment site(attP)优化,快速识别出叠加突变组合,显著提高了重组酶的效能。
研究主要采用了以下关键技术方法:
  1. 1.1.
    定向进化与DNA shuffling:在E. coli中进行12轮进化筛选,结合单点饱和诱变和片段重组,获得携带中位3个氨基酸突变的高活性变体库;
  2. 2.2.
    机器学习预测:利用线性回归和岭回归模型,根据单突变数据预测高阶突变体的活性和特异性,指导理性设计;
  3. 3.3.
    dCas9融合与sgRNA招募:通过C端融合dCas9并优化sgRNA设计,同时招募重组酶至基因组靶点和供体DNA,提高局部浓度与整合效率;
  4. 4.4.
    供体attP序列优化:通过混合碱基 oligo 库筛选,得到优化后的 e-attP 序列,进一步提高整合效率;
  5. 5.5.
    多细胞模型验证:在HEK293FT、人胚胎干细胞(hESC)、诱导多能干细胞(iPSC)及原代T细胞等多种模型中测试工程化酶的性能,并通过流式细胞术、ddPCR、NGS整合位点分析等多手段评估效率、特异性及安全性。

A framework for recombinase engineering to enable site-specific genome insertion

研究人员首先建立了重组酶工程化框架,针对Dn29在内源性伪位点attH1(位于NEBL基因内含子)整合效率低(5%)、且存在attH2、attH3、attH4等主要脱靶位点的问题,设定了三个优化目标:提高attH1整合效率、降低主要脱靶频率、减少低频脱靶事件。他们采用定向进化策略,在E. coli中利用含attH1和attP的报告质粒进行正选择,通过多轮突变与筛选,获得活性提高的变体。

Directed evolution of LSRs with improved efficiency and specificity

经过12轮进化及两次DNA shuffling,测序结果显示变体库中每位点平均携带3个氨基酸突变,72%的变体携带2-6个突变。功能实验发现,大多数变体仅增强效率或特异性之一。将高效变体62(效率提高2.5倍)与高特异变体93(特异性提高8.6倍)的突变组合,得到变体127,其特异性提高13.4倍,效率提高1.8倍。

Computational modeling and structural analysis of recombinase mutation stacking

为加速高阶突变体的实验测试,研究人员建立了机器学习模型,从单突变数据预测组合变体的活性。岭回归模型在预测效率(NDCG=0.970)和特异性(NDCG=0.971)方面表现最佳,模型系数与实验测得的突变影响高度相关(特异性ρ=0.930, P<0.0001)。利用此模型,他们成功预测出在superDn29基础上添加双突变的高阶变体,实验验证其中80%的效率变体和100%的特异性变体优于superDn29。
通过AlphaFold3结构建模,他们发现效率突变热点位于卷曲螺旋铰链区(如L388P、Q390P等),可能通过破坏螺旋二级结构增强活性;而特异性突变多位于DNA结合界面附近,常将中性氨基酸替换为带正电荷残基(如N341K),可能增强DNA相互作用。

Target and donor DNA recruitment with LSR-dCas9 fusions

为实现基因组靶点与供体的同步招募,研究人员构建了C端dCas9融合蛋白(N端融合会因阻碍四聚化而失效)。使用靶向attH1或attH3近端的sgRNA,可将Dn29-dCas9在attH1的整合效率提高2.7倍,在attH3提高6倍。有趣的是,dCas9招募可操纵Dn29的天然整合偏好:attH1靶向sgRNA将其对attH1的偏好从2倍提高至14倍,而attH3靶向sgRNA则使整合偏好转向attH3(11倍高于attH1)。
将dCas9融合与优化变体结合,进一步提升了性能:superDn29-dCas9在attH1实现53%的整合效率,goldDn29-dCas9和hifiDn29-dCas9分别达到44.5%和39.1%,较野生型提高最高11.8倍。全基因组整合谱分析显示,WT Dn29仅12%的整合发生在on-target,而Dn29-dCas9提升至60%以上,goldDn29-dCas9和hifiDn29-dCas9更达到91%和97%的全基因组特异性,脱靶位点显著减少。

Exploring attP sequence space enables the design of optimized donor DNA

研究人员还通过attP序列优化增强供体招募。他们构建了分别突变attP-L和attP-R半位点的库,转染表达WT Dn29-dCas9的细胞,通过测序整合产物计算核苷酸富集分数。虽然野生型核苷酸通常更受偏好,但他们发现6个位点的非WT核苷酸具有中度更高富集。将这些替换组合成优化e-attP序列后,整合效率提高1.3倍。

Unifying engineering strategies for maximal LSR efficiency and specificity

联合所有工程化策略(定向进化变体、dCas9融合与sgRNA设计、优化供体attP)后,变体与dCas9融合及优化供体相结合,在attH1实现41-53%的整合效率,较野生型酶提高9.6-12.3倍。
在单细胞水平评估编辑结果发现,dCas9融合显著提升了性能:hifiDn29-dCas9处理的克隆中95%含有on-target编辑,且脱靶插入仅9%,而WT Dn29-dCas9为52%。此外,dCas9提高了多次on-target插入的比例,hifiDn29-dCas9显示最高的单次on-target插入事件率(50%的克隆)。

Characterization of undesired editing outcomes

安全性评估显示,在attH1处检测到罕见但显著的indel(0.01-1.4%),其频率与重组效率相关。γ-H2AX染色表明,特异性增强变体(goldDn29和hifiDn29)将DNA损伤降至背景水平,且低于此前报道的最高保真重组酶Bxb1。细胞活性实验未见显著毒性,全基因组连接测序发现基因组重排率低(0-2%为染色体内,0-0.3%为染色体间)。

Engineered LSR systems insert multi-kilobase DNA cargo into the genome of non-dividing cells, human embryonic stem cells and primary T cells

在细胞周期停滞的HEK293FT中,Dn29及关键变体整合率与未处理细胞基本相当。在H1 hESC中,工程化重组酶的on-target整合效率较WT Dn29提高最多6倍(达24.5%),脱靶整合接近ddPCR检测限。
研究人员设计了一个12 kb的CRISPR干扰(CRISPRi)构建体,包含ZIM3-dCas9融合、BFP、新霉素抗性标记等元件,通过goldDn29-dCas9在hESC中实现高效整合。基因分型显示95%的克隆具有精确的杂合attH1插入,且经过分化成为造血祖细胞(HPC)后仍保持稳定的cargo表达(约70% BFP+)和表面标志物(CD34、CD43)表达。
在原代T细胞中,他们开发了多种递送策略。电递效应mRNA及合成sgRNA,并通过ssAAV或scAAV递送供体模板,LSR-dCas9融合实现了高达17%的AAV整合效率,且细胞活性高。使用5.8 kb质粒表达CD19靶向CAR,在原代T细胞中达到11%的整合效率,并在体外癌细胞杀伤试验中显示出强劲的细胞毒性。
此外,Dn29和goldDn29还能与小鼠、多种非人灵长类动物中存在的attH1样序列发生交叉反应,有利于推动临床前动物研究。

结论与意义

该研究通过多维策略成功工程化了LSR,使其成为一种高效、精准、安全的大片段DNA插入工具。其创新性在于:
  1. 1.1.
    联合定向进化、机器学习与结构分析,理性设计出具有叠加效应的高性能变体;
  2. 2.2.
    通过dCas9融合实现基因组与供体的同步招募,显著提升效率与特异性;
  3. 3.3.
    优化供体attP序列,进一步增强重组效率;
  4. 4.4.
    在多种重要细胞模型(包括非分裂细胞、干细胞、原代T细胞)中验证其适用性,为体内应用奠定基础。
这些工程化重组酶克服了现有编辑工具的局限,无需预装着陆垫即可实现高效、精准、大容量的基因组整合,为基因电路集成、大规模 pooled 文库构建、全基因替换治疗及细胞疗法开发提供了强大工具,有望广泛应用于生物医学研究与临床治疗。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号