CHANGE-seq-BE:一种灵敏且无偏的碱基编辑器脱靶效应全基因组分析新方法

《Nature Biotechnology》:Sensitive and unbiased genome-wide profiling of base-editor-induced off-target activity using CHANGE-seq-BE

【字体: 时间:2026年01月03日 来源:Nature Biotechnology 41.7

编辑推荐:

  本刊推荐:本研究开发了CHANGE-seq-BE方法,实现了对腺嘌呤碱基编辑器(ABE)和胞嘧啶碱基编辑器(CBE)引导RNA(gRNA)依赖性脱靶活性的高灵敏度、无偏性全基因组分析。该方法通过选择性测序体外碱基编辑器修饰的基因组DNA(gDNA),克服了现有方法(如Digenome-seq)测序深度要求高或存在计算预选偏倚(如ONE-seq)的局限性。研究证实ABE8e比Cas9核酸酶具有更高的脱靶活性,并成功应用于支持治疗CD40L缺陷性X连锁高IgM综合征(X-HIGM)的紧急研究性新药(IND)申请中的基因毒性研究,凸显了其在临床前安全评估中的重要价值。

  
开发灵敏且无偏的生化方法以测量碱基编辑器全基因组活性
碱基编辑器(Base editors),如腺嘌呤碱基编辑器(ABEs)和胞嘧啶碱基编辑器(CBEs),能够在不引起DNA双链断裂(DSBs)的情况下精确安装单碱基改变,在治疗遗传疾病方面潜力巨大。然而,与其它基因编辑器一样,碱基编辑器也可能在具有序列同源性的脱靶基因组位点产生非预期修饰,因此需要灵敏且无偏的方法来评估其安全性。现有方法,如Digenome-seq和EndoV-seq,依赖于对体外碱基编辑器处理的gDNA进行全基因组测序(WGS),需要数亿测序读长,灵敏度低、成本高且可扩展性差。而ONE-seq等方法则依赖于计算预选候选脱靶位点,存在偏倚。
为此,研究人员开发了CHANGE-seq-BE方法。该方法基于此前为Cas9核酸酶开发的CHANGE-seq方法进行优化,旨在实现对碱基编辑器修饰的gDNA进行选择性测序。其工作流程包括:纯化的gDNA通过含有环化接头DNA的定制Tn5转座酶进行标签化(tagmentation);标签化gDNA通过分子内连接环化;残余线性DNA被核酸外切酶混合物降解,获得高纯度的gDNA环;环化gDNA在体外与ABE或CBE核糖核蛋白(RNP)复合物孵育,在脱靶位点切割目标DNA链并将非目标链上的腺嘌呤脱氨为次黄嘌呤(inosine, ABE)或胞嘧啶脱氨为尿嘧啶(uracil, CBE);对于ABE,含有切口和次黄嘌呤的gDNA环随后被内切核酸酶V(endonuclease V)处理,该酶切割次黄嘌呤相邻的DNA;对于CBE,含有尿嘧啶的DNA环被USER酶(一种尿嘧啶DNA糖基化酶和DNA糖基化酶-裂合酶内切核酸酶VIII的混合物)处理,切除尿嘧啶碱基,产生具有5′突出端的线性DNA;最后,这些线性DNA分子经过末端修复、连接测序接头并扩增,用于选择性高通量测序。
经过系统的流程优化(包括环化gDNA的核酸外切酶处理、碱基编辑反应条件和末端修复方案),CHANGE-seq-BE能够一致地检测到所有先前验证过的ABE8e-NRCH:HBBS-gRNA的54个脱靶位点。对于ABE,CHANGE-seq-BE读长捕获了体外碱基编辑的独特分子特征,即次黄嘌呤碱基在PCR扩增后转化为鸟嘌呤(G),表现为A-to-G的脱氨频率,在提名的主要脱靶位点中观察到25%至48%的脱氨频率。该方法也适用于CBEs(如eA3A-BE3),尽管C-to-T的碱基转换在CHANGE-seq-BE读长中不可检测,但断裂点位置仍然清晰。
CHANGE-seq-BE为ABE8e-NRCH:HBBS靶点识别新的真实脱靶位点
对ABE8e-NRCH靶向HBBS的CHANGE-seq-BE实验显示,技术重复间的读长计数高度相关(Pearson相关系数r = 0.9814),脱靶活性位点广泛分布于整个基因组。与使用同源Cas9核酸酶的CIRCLE-seq方法相比,CHANGE-seq-BE和CIRCLE-seq的读长计数仅弱相关(r = 0.34),且两种方法检测到的脱靶位点只有40%重叠,表明ABE8e的全基因组脱靶活性在数量上不同于Cas9核酸酶。
为了确认CHANGE-seq-BE独家检测到的新脱靶位点是否在细胞中是真实存在的,研究人员对之前研究中使用过的、经ABE8e-NRCH mRNA处理的CD34+造血干祖细胞(HSPCs)的相同gDNA,对131个仅由CHANGE-seq-BE检测到的位点进行了多重靶向测序。结果发现,CHANGE-seq-BE不仅识别了全部54个已知的细胞脱靶位点,还额外发现了29个先前未知的真实脱靶位点,比最初使用CIRCLE-seq的筛选多出53%,其ABE活性范围在0.55%至13.9%之间。对于HBBS-gRNA的真实脱靶位点,CHANGE-seq-BE的富集比显著高于CIRCLE-seq,平均高出2.1倍。这些脱靶活性主要发生在基因间区和内含子区,有6个脱靶位点位于外显子区。
CHANGE-seq-BE灵敏地识别人类原代细胞中的真实脱靶位点
为了系统评估ABEs和CBEs在体外的全基因组脱靶活性,研究人员在人类原代T细胞(靶点:B2M, CBLB, CD7, CIITA, PDCD1)和人类原代肝细胞(靶点:PCSK9)上进行了CHANGE-seq-BE。对于这六个gRNA靶点,CHANGE-seq-BE在两个实验重复中提名了总共4,199个靶向和脱靶位点(范围从236到1,604个)。
为了比较CHANGE-seq-BE与另一种领先的脱靶发现方法Digenome-seq的灵敏度,研究人员对相同的gRNA靶点进行了Digenome-seq。Digenome-seq共识别出796个靶向和脱靶位点(范围从36到162个)。随后,通过杂交捕获测序(hybrid capture sequencing)全面评估了4,291个由任一方提名且成功捕获和扩增的位点,在其中96个位点检测到显著的脱靶改变,细胞活性范围从0.44%到93.1%。在83个(共96个)T细胞真实脱靶位点中,33.3%至100%的位点被两种方法共同识别,6.9%至16.7%的位点仅由Digenome-seq识别,而29.3%至55.6%的位点仅由CHANGE-seq-BE独家识别。对提名和真实脱靶位点的基因组位置注释分析显示,两者均主要分布在基因间区和内含子区。与CHANGE-seq-BE提名的脱靶位点(10.3%)相比,真实细胞脱靶位点(17.7%)在转录区域显著富集。
同样,对CBE(eA3A-BE3)靶向B2M, CBLB, CD7, CIITA, PDCD1的研究中,CHANGE-seq-BE提名了总共850个位点,而Digenome-seq仅提名了25个位点。杂交捕获测序验证显示,两种方法都检测到所有靶点的高频靶向编辑(52.3%至97.6%)以及CIITA的一个高频脱靶位点(编辑率17%)。然而,许多编辑率在1.7%至7.5%的低频脱靶位点仅被CHANGE-seq-BE发现,而未被Digenome-seq识别。
总之,CHANGE-seq-BE比Digenome-seq更灵敏,同时所需测序读长减少20倍。CHANGE-seq-BE是碱基编辑器细胞脱靶活性的强预测指标,可用于常规和治疗应用中候选靶点的选择。
CHANGE-seq-BE识别出意外的合成gRNA污染物
与人类基因编辑产品相关的安全风险包括非预期的脱靶和靶向活性及其长期后果。一个不太明显但关键的问题是,关键基因组编辑组件(如gRNA)的污染可能导致基因编辑指向非预期的靶向位点。
在最初使用研究级、化学合成并经高效液相色谱(HPLC)纯化的gRNA进行CHANGE-seq-BE实验试点时,研究人员在碱基编辑器处理的样本中观察到跨多个靶点的CHANGE-seq-BE读长计数,而在未处理的对照中则没有,这提示了存在污染的合成gRNA活性。例如,在用CBLBgRNA靶点处理的gDNA样本中,检测到PDCD1, CD7CIITA靶点处强烈的非预期活性。据制造商讨论,这种交叉污染最可能的来源是在同一HPLC柱上顺序纯化这些gRNA。在第二批来自同一制造商的gRNA中,通过采用更严格的柱清洗程序,可检测的交叉污染活性得到了缓解。
为了识别和测量污染gRNA的频率,研究人员使用了一种基于成熟小RNA测序技术的gRNA测序方法。评估了来自三家合成gRNA制造商(A, B, C)的五条研究级gRNA序列中是否存在gRNA污染物。在供应商A(批次1)的CBLBCIITAgRNA中检测到污染gRNA的存在,频率范围在0.09%至2.71%。
为了确定在体外通过CHANGE-seq-BE活性和gRNA测序检测到的相对微量的gRNA污染物是否在细胞中具有活性,研究人员对用供应商A生产的靶向CBLBCIITA位点的ABE8e编辑的原代人类T细胞的gDNA进行了靶向测序。对于旨在进行CBLB编辑的细胞,额外评估了PDCD1CIITA靶向位点的编辑;对于旨在进行CIITA编辑的细胞,额外评估了PDCD1CD7靶向位点的编辑。在所有与污染gRNA相关的非预期靶向位点均检测到与腺嘌呤碱基编辑一致的点突变,活性范围在0.83%至5.24%。
这一发现凸显了使用灵敏、无偏的全基因组方法进行碱基编辑器脱靶发现的另一个优势:识别污染gRNA的非预期“靶向”活性。当使用相同的色谱设备纯化多个化学合成gRNA时,这可能是一个普遍存在的问题,特别是在治疗应用中,需要谨慎以最小化gRNA合成污染风险。
CHANGE-seq-BE揭示核酸酶和碱基编辑器之间的生物学活性差异
为了评估碱基编辑器(ABE8e)和核酸酶(Cas9)之间的生化活性差异,研究人员还在人类原代T细胞的相同五条gRNA(B2M, CBLB, CD7, CIITA, PDCD1)上进行了CHANGE-seq(使用Cas9核酸酶)。CHANGE-seq为所有五个靶点检测到总共7,430个靶向和脱靶位点(而CHANGE-seq-BE为3,734个位点)。实验重复间的读长计数在CHANGE-seq(r > 0.86)和CHANGE-seq-BE(r > 0.96)中均高度相关。然而,在不同方法之间,CHANGE-seq和CHANGE-seq-BE的读长计数相关性较低,且随gRNA靶点不同而变化(r = 0.2–0.73)。这表明ABE8e碱基编辑器和Cas9的生化活性都具有高度可重复性且彼此不同。
为了直接评估Cas9核酸酶和ABEs在细胞脱靶活性方面的差异,研究人员用Cas9 mRNA编辑了所有五个靶点的T细胞,并对总共2,226个脱靶位点(包括1,436个仅由Cas9 CHANGE-seq提名的脱靶位点)进行了杂交捕获靶向测序。所有五个靶点均实现了ABE8e(96.5–99.4% A-to-G碱基编辑)和Cas9(70.7–92% 插入缺失)的高频靶向编辑。对于ABE8e,在所有五个靶点共识别出83个T细胞真实脱靶位点,碱基编辑频率范围从0.44%到93.1%。相比之下,对于Cas9,仅确认了一个真实脱靶位点(靶向PDCD1),平均插入缺失为2.4%。
为了独立验证杂交捕获测序测量的编辑活性,研究人员对所有五个靶点进行了GUIDE-seq-2(使用mRNA递送Cas9)。在匹配的递送条件下,观察到的GUIDE-seq-2脱靶活性谱与杂交捕获靶向测序结果一致,只有PDCD1的OT01明显高于GUIDE-seq-2的检测下限。使用Cas9 RNP进行的GUIDE-seq-2产生了稍多但仍相当低的脱靶活性,范围在0.01%至3.4%。
总体而言,碱基编辑器在与同源核酸酶直接比较时具有不同的脱靶编辑谱。例如,在受控递送条件下对Cas9和ABE8e的比较表明,ABE8e比Cas9具有显著增加的脱靶活性,98.8%的已验证脱靶位点为ABE8e所独有。因此,必须使用直接方法来评估碱基编辑器的脱靶活性,而不能仅仅依赖基于核酸酶的方法。
CHANGE-seq-BE支持针对个性化基因组编辑治疗的紧急IND申请
研究人员应用CHANGE-seq-BE的灵敏脱靶检测能力,定量表征了一种ABE碱基编辑策略的全基因组gRNA依赖性脱靶谱,该策略旨在通过纠正CD40L突变(c.658C>T; p.Q220X)来治疗一名X连锁高IgM综合征(X-HIGM)患者。使用CHANGE-seq-BE,研究人员在整个人类基因组中识别出总共81个潜在脱靶位点,且两个技术重复间的实验相关性良好。这些脱靶位点大多数发生在内含子和基因间区,有两个位于外显子区。通过使用rhAmpSeq进行多重靶向测序验证,观察到95.4%的靶向编辑,与对照组相比,未检测到高于阈限值的脱靶效应。这成功支持了一项针对CD40LHIGM综合征患者的紧急个性化碱基编辑器造血干细胞和T细胞治疗的紧急研究性新药(IND)申请(临床试验编号NCT06959771),证明了CHANGE-seq-BE在支持IND申请方面的作用。
讨论
本研究描述的CHANGE-seq-BE方法,为全面分析碱基编辑器全基因组活性提供了一种同时具备高灵敏度和无偏性的途径。该方法结合了理想特性,可在单一方案内直接识别gRNA依赖性碱基编辑器脱靶效应,并良好适用于ABEs和CBEs。
该方法也存在一些局限性。首先,CHANGE-seq-BE文库目前需要比核酸酶的CHANGE-seq文库更高的测序深度才能达到相当的靶向读长计数。其次,与其他生化方法一样,其表观验证率较低。第三,所有表征编辑器全基因组活性的生化方法的一个内在局限性是需要纯化的蛋白质。最后,CHANGE-seq-BE并非设计用于检测gRNA非依赖性脱靶效应。
CHANGE-seq-BE相较于现有方法在灵敏度和测序效率方面具有关键优势。与依赖碱基编辑器修饰gDNA的WGS的生化方法(如Digenome-seq)相比,CHANGE-seq-BE观察到的背景读长率显著降低,使其在测序效率提高约20倍的同时实现了更高的灵敏度。相对高效的测序需求(每个样本约2500万读长)使得CHANGE-seq-BE可供大多数能够使用短读长高通量测序仪的实验室使用。
另一个优势是CHANGE-seq-BE能够直接分析碱基编辑器活性,而不是依赖于核酸酶和碱基编辑器活性相同的错误假设。本研究结果清楚地表明,核酸酶和碱基编辑的脱靶活性在生化环境和细胞环境中均存在显著差异。研究发现,在受控的细胞递送条件下,ABE8e诱导了更多检测到的脱靶位点以及相当高频率的脱靶编辑活性。
CHANGE-seq-BE与支持IND申请的临床基因组编辑方法的表征相关。本研究中的一个例子是,我们成功使用CHANGE-seq-BE提名候选脱靶位点,清除了一项IND申请,并用旨在纠正其致病突变的碱基编辑器治疗了一名X-HIGM综合征患者。
本研究一个有趣的观察是,具有预期靶序列的gRNA在合成过程中常规色谱步骤期间可能被其他gRNA污染,这些低频污染物在CHANGE-seq-BE等生化测定以及细胞中均导致了可测量的活性。每当使用合成gRNA时,考虑和测量污染gRNA的这种非预期“靶向”活性将很重要。
一个普遍的挑战是潜在碱基编辑器脱靶位点的功能解释。一旦得到更好的理解,可以应用几种策略来减轻有害的脱靶效应并提高碱基编辑器的安全性和精确性。
总体而言,凭借高灵敏度和测序效率的有利特性,预计CHANGE-seq-BE将作为无偏发现方法,在生命科学研究和临床应用中对表征碱基编辑器的全基因组gRNA依赖性脱靶活性方面得到越来越广泛的应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号