编辑推荐:
本文聚焦核糖核蛋白(RNP)颗粒转录组学。RNP 颗粒在生物进程和疾病中意义重大,了解其 RNA 组成至关重要。文中综述了颗粒转录组分析的新进展,涵盖纯化策略、邻近标记技术等,为深入探究 RNP 颗粒生物学提供了重要参考。
RNA:相分离中的核心角色
相分离是细胞区室化的基本机制,许多相分离的生物分子凝聚物富含 RNA 和 RNA 结合蛋白,即核糖核蛋白(RNP)颗粒。RNP 颗粒在多种细胞类型和生物体中被发现,在应激反应、发育、衰老等生理过程中发挥重要作用 ,其功能异常与癌症、病毒感染、神经退行性疾病等相关。
以往对 RNP 颗粒形成的研究多关注含内在无序区域的蛋白质,而近期研究表明 RNA 自身在颗粒组装中起核心作用。RNA 作为长聚合物,有众多蛋白质或其他 RNA 的结合位点,可通过多价相互作用促进凝聚物形成。如应激颗粒和核颗粒(包括核仁)的组装依赖 RNA,转录抑制或 RNase 激活会使其消失或重排 。特定的长链非编码 RNA,如 NEAT1 和 HSATIII,分别是副斑点和核应激小体组装所必需的 。此外,纯化的细胞 RNA 混合物、均聚物(如聚尿苷酸)和病理性重复 RNA 在体外可自组装。RNA 结合蛋白如 eIF4A 和 YB-1 也作为 RNA 伴侣,调节 RNA - RNA 相互作用,影响应激颗粒形成。而且,根据 RNA 的二级结构,丝状真菌阿舒假囊酵母中的 Whi3 液滴具有不同的粘度和动态特性。这些都说明 RNA 是 RNP 颗粒形成和特性的关键决定因素。
RNP 颗粒在 RNA 代谢和基因调控中意义重大,其与翻译的关系也备受关注。细胞质 RNP 颗粒,如应激颗粒和加工小体(P - bodies),常含有未翻译、无核糖体的 mRNA。光遗传学凝聚和体外重构实验表明,mRNA 凝聚可导致翻译抑制;相反,相分离也能提供活跃的翻译位点,甚至增强储存 mRNA 的翻译。RNP 颗粒还参与 RNA 运输,神经元 RNA 颗粒可沿轴突中的微管迁移。此外,多种核 RNP 颗粒在转录活跃的基因位点形成,提示其与转录存在联系,但 RNP 颗粒是否直接调控这些过程仍有争议。因此,了解 RNP 颗粒的 RNA 组成对阐明其形成机制和功能至关重要。
颗粒纯化方法
差速离心法纯化颗粒
RNP 颗粒转录组分析常依赖免疫沉淀和深度测序,如单核苷酸分辨率交联免疫沉淀测序(iCLIP - seq),但颗粒成分在结合和游离状态间平衡,仅约 18% 的 G3BP1 在哺乳动物应激颗粒中 ,约 30% 的 Dcp2 和 Edc3 在酵母 P - bodies 中被隔离在颗粒内,所以需对 RNP 颗粒进行生化纯化或标记以精确捕获其转录组。
差速离心法是最直接且常用的颗粒分离方法。RNP 颗粒密度相对较高,可通过简单的台式离心沉淀。通常,细胞裂解物先低速(~1,000 × g)离心去除碎片、细胞核和其他大细胞器,上清液再以 10,000 - 18,000 × g 离心分离颗粒。不过,沉淀部分还包含各种 RNP 颗粒和类似沉降的膜性细胞器,如内质网(ER)和线粒体,因此需通过标记蛋白的免疫沉淀进一步纯化特定的 RNP 颗粒。
差速离心法最初用于分析酵母和哺乳动物细胞中应激颗粒的蛋白质组,后应用于应激颗粒转录组分析。与核糖体分析数据对比发现,长且翻译效率低的 RNA 会积累。在应激条件下纯化 P - bodies,甚至在未进行免疫沉淀的情况下广泛分离富含颗粒的沉淀部分时,都观察到转录本长度和翻译效率的偏差,这表明 RNA 长度和翻译状态可能是多种细胞质 RNP 颗粒的共同特征 。
该方法已广泛应用于多种颗粒和生物体研究。如对细菌 RNP(BR)小体的研究发现,其积累了更长、翻译受抑制的 mRNA,与真核生物颗粒类似。差速离心法还助力研究疾病与 RNP 颗粒的联系,如携带肌萎缩侧索硬化(ALS)突变的神经母细胞瘤细胞中的应激颗粒 、T 淋巴细胞激活过程中的 P - bodies 和应激颗粒 ,以及病毒感染细胞邻近细胞中类似应激颗粒的旁分泌颗粒 。此外,颗粒沉淀法在体外也有效,成功分析了纯化酵母 RNA 自组装形成的聚集体成分,发现无蛋白质组装的 RNA 特性与细胞应激颗粒中 mRNA 的特征相关。向无颗粒裂解物(颗粒沉淀后的上清液)中添加重组蛋白重构的应激颗粒或核仁,在蛋白质组和转录组上与细胞内的对应物相似。
但差速离心法存在局限,只能回收稳定的颗粒或抗裂解、离心和免疫沉淀的区域。离心分离的应激颗粒比细胞内的小,说明其外周壳扩散,仅纯化了稳定的核心。而且,该方法需要大量细胞,有研究报道需在 500 cm2的培养皿中培养细胞 。
密度梯度或尺寸排阻色谱法纯化颗粒
密度梯度离心法可将 RNP 颗粒与膜性细胞器分离。例如,利用 15 - 30% 碘克沙醇梯度和超速离心,可从小鼠脑裂解物中分离 RNP 颗粒与内质网,后续免疫沉淀可用于分析含 Staufen 的 RNP 颗粒转录组。优化该方法可进一步减少交叉污染,如调整裂解液密度(溶解在 30% 碘克沙醇中)并置于梯度底部,此时膜性细胞器移至顶部组分,细胞质 RNA 和蛋白质移至底部,较轻的胞质组分被认为富含颗粒,因其 RNA 核糖体结合率低且转录本较长,与应激颗粒和 P - bodies 的转录组特征相符。该方法还能从同一裂解液中纯化多种细胞器,追踪应激反应下 RNA 的重新分布,如未折叠蛋白反应时,许多 mRNA 从膜组分转移到较轻的胞质组分。
由于应激颗粒大小不一,许多较小颗粒会逃脱标准离心。为此,开发了一种避免颗粒沉淀的方法,先通过短暂离心去除大细胞器,再用蔗糖密度梯度分离核糖体和活跃翻译的 mRNA,随后使用标称排阻极限为 100 MDa 的树脂进行尺寸排阻色谱,分离出相对较大但密度低、不易沉淀的颗粒。
荧光激活颗粒分选(FAPS)
基于 RNP 颗粒近球形的形态,开发了一种利用细胞分选仪的分离方法 —— 荧光激活颗粒分选(FAPS)。该方法用荧光蛋白标记颗粒,细胞裂解后,通过荧光激活细胞分选仪根据荧光强度分选细胞。FAPS 可消除无颗粒的标记蛋白和其他 RNPs,获得高纯度颗粒。
FAPS 最初应用于 P - bodies 研究,发现其中富含翻译受抑制的 mRNA 以及与染色质重塑和细胞分裂相关的调节性 mRNA。后续研究表明,m6A 修饰影响 P - body 转录组 ,且 P - bodies 的 RNA 组成在上皮 - 间质转化 、细胞周期进展 、人类胚胎干细胞向中胚层细胞分化过程中动态变化。除 P - bodies 外,FAPS 还应用于与糙面内质网交织的 TIS 颗粒 、自噬 p62 小体 、促进骨转移的 DACT1 凝聚物 ,以及拟南芥中的光敏色素 B 光小体 和 ECT1 m6A 阅读器凝聚物 。
FAPS 与差速离心法类似,无法回收在裂解和分选过程中解体的不稳定颗粒。不过,甲醛介导的交联可稳定颗粒,扩大 FAPS 的应用范围。如应激颗粒易在细胞裂解时解体,原本不适用 FAPS,但固定处理解决了这一问题,使含 DHX9 的 RNA 损伤诱导亚型得以分选 。该方法还实现了对线虫卵母细胞 P - bodies 的分离,其在卵子发生过程中动态生长 。此外,体外重构的 FUS 液滴在裂解液中也可通过交联方法成功分选 。FAPS 的另一个局限是需要较多细胞(此前使用 FAPS 时,用了两个 15 cm 培养皿的细胞 和约 1000 只线虫 ),且获取足够数量的颗粒耗时较长,如分选足够用于蛋白质组学或转录组学分析的 P - bodies 需要约 6 - 12 小时 。
其他研究方法
半可提取 RNA 作为颗粒 RNA
传统上,RNA 用酸胍硫氰酸盐 - 苯酚 - 氯仿(AGPC)试剂(如 TRIzol)分离,被分离到水相,蛋白质留在有机相。然而,纳入相分离结构(如 NEAT1)的 RNA 与许多蛋白质形成多价相互作用,在 AGPC 方法中富集于液 - 有机相界面。而且,剧烈的针剪切或加热可增加这些 RNA 在水相中的溶解度,这种 “半可提取性” 是相分离颗粒内 RNA 的特征。半可提取 RNA 包括核 lncRNAs、前体 mRNAs、反义 RNAs 和重复 RNAs,它们组装成核颗粒样结构。
基于过氧化物酶的邻近标记
颗粒纯化需多步生化操作,可能破坏颗粒完整性和改变其天然状态。为克服这一局限,开发了细胞内标记方法,可在活细胞中直接对颗粒 RNA 进行生物素化。其中一种重要策略是使用 APEX2,它是由大豆抗坏血酸过氧化物酶人工进化而来的酶,在过氧化氢处理下可从酚类物质产生自由基。生物素与酚结合,能将该分子标签添加到蛋白质和 RNA 上。产生的自由基反应性高但寿命短(<1 ms) ,仅在酶活性位点附近(<20 nm)进行生物素化 。由于自由基的扩散和衰减,标记效率随距离增加而降低,而非局限于固定半径 。
APEX2 最初用于标记生物素连接酶等蛋白质,也能直接对 RNA 进行生物素化,实现局部转录组的 APEX - Seq 分析。因标记在活细胞中进行,基于 APEX2 的方法可捕获不适合生化纯化的不稳定颗粒。不过,靠近标记蛋白但不在颗粒内的 RNA 也可能被标记,所以需设置合适的对照(如不形成颗粒的标记突变体)确保特异性。APEX - Seq 已揭示许多膜性和无膜细胞器的局部转录组,包括核仁和应激颗粒 。以 eIF4A1 为应激颗粒标记,该方法发现热休克诱导的应激颗粒积累更长的转录本,与早期生化纯化结果一致 。有趣的是,当用喜树碱醇(eIF4A 抑制剂)诱导应激颗粒时,未观察到转录本长度的偏差,表明应激颗粒组成可能因刺激不同而变化。APEX - Seq 还应用于含 DDX3X 和 DDX3Y 的应激颗粒研究 。
APEX - Seq 存在一些局限性,如对核酸的标记效率相对较低,酚氧自由基优先与富电子的鸟嘌呤反应,但效率低于与氨基酸(如酪氨酸)的反应 。为提高 RNA 标记效率,研究人员用生物素 - 苯胺替代生物素 - 酚 ,或在细胞 RNA 中代谢掺入富电子的核糖核苷,如 4 - 硫尿苷或 6 - 硫鸟苷 。此外,生物素 - 酚在某些生物体(如酵母)中的通透性较低,可使用更小、通透性更好的炔酚混合物,RNA 提取后与叠氮生物素进行点击反应解决这一问题 ,该方法已成功应用于大肠杆菌的细菌 RNP(BR)小体 。最近,有报道称叠氮酚具有较高的 RNA 标记效率,且亲水性和疏水性平衡理想 。
在某些情况下,RNA 比蛋白质更适合作为定义 RNP 颗粒的标记。APEX2 可通过 MS2 茎环系统或催化失活的 Cas13(一种依赖引导 RNA 的 RNA 靶向酶)招募到标记 RNA 上,而非与标记蛋白融合 。这种基于 RNA 的标记可捕获靠近人类端粒酶 RNA 的蛋白质 。在固定细胞中,多个地高辛(DIG)标记的探针可与靶 RNA 杂交,然后招募与 APEX2 融合的 DIG 结合蛋白 ,该技术称为杂交邻近(HyPro) - Seq,可揭示由 45S 前 rRNA(用于核仁)、NEAT1(用于副斑点)和 PNCTR(用于核仁周边区)定义的 RNP 颗粒的转录组。
利用辣根过氧化物酶(HRP)也可进行无 APEX2 标记的邻近标记 。但 HRP 的应用限于细胞表面蛋白,因其活性依赖二硫键和 Ca2 +结合位点,在细胞质的还原环境中会被破坏。不过,在固定和通透的细胞中,HRP 偶联的二抗可像免疫染色一样进行邻近标记 。该基于 HRP 的方法已用于鉴定颗粒附近的 DNA 区域 ,以及最近用于分析 Cajal 体 和 KRAS 诱导颗粒的转录组 。
光控邻近标记
基于 APEX 的方法中过氧化氢处理时间虽短,但潜在毒性令人担忧。为解决这一问题,开发了光驱动的邻近标记策略 —— 发色团辅助邻近标记(CAP) - Seq。CAP - Seq 使用小型单线态氧发生器(miniSOG),在蓝光照射下产生活性氧(ROS)。与酚氧自由基类似,ROS 反应性高但寿命短 ,可靶向附近 RNA 的鸟嘌呤碱基。RNA 提取后,氧化的鸟嘌呤与炔胺偶联,再通过点击反应进行生物素化。CAP - Seq 已应用于应激颗粒转录组分析 。虽然 CAP - Seq 需要 15 - 20 分钟的光照,时间分辨率低于基于 APEX2 的方法(1 分钟过氧化氢处理),但特异性相当,可作为互补工具。
除酶外,光响应小分子也用于产生 ROS 以氧化 RNA。HaloTag 是一种源自卤代烷脱卤酶的蛋白质,可与小分子化合物(HaloTag 配体)共价结合 。Halo - Seq 使用与配体偶联的二溴荧光素(DBF),在光照下产生 ROS ,并通过与细胞器标记蛋白融合的 HaloTag 招募到目标区域,从而揭示核仁转录组 。由于 DBF 产生的 ROS 产量比 MiniSOG 高 ,RNA 标记效率得到提高。
鉴于对更高精度的需求,出现了更精细的方法。自由基和 ROS 在衰减前会扩散,导致标记半径较宽。一种策略是利用紫外线照射二氮杂环丙烷产生单线态卡宾 。单线态卡宾半衰期极短(~1 ns),比生物素 - 酚氧自由基(<1 ms) 和 ROS(~10 μs)短得多 ,能立即与生物分子结合或被水淬灭,标记半径约 2 - 4 nm 。在光邻近蛋白相互作用(PhotoPPI)中,通过 SNAP - tag 系统(与 HaloTag 正交)将含有二氮杂环丙烷、生物素和可紫外线裂解连接子的定制化合物定向到特定细胞位置 。紫外线激活后,产生的卡宾共价标记附近的蛋白质。
一种新开发的铱光催化剂实现了更窄的标记半径 。在蓝光照射下,催化剂被激发并将能量转移到附近的二氮杂环丙烷,产生单线态卡宾。用与催化剂偶联的抗体进行超分辨率显微镜观察表明,基于二氮杂环丙烷的方法标记半径在低纳米范围内,比基于过氧化物酶的标记窄得多(可达 200 倍) 。最初该催化剂细胞通透性差,限制其用于细胞外微环境映射(μMap) ,但后续通透性的改进使其可通过 HaloTag 招募到细胞内应激颗粒进行蛋白质组分析 。最近,催化剂的进一步改进实现了对核 RNP 颗粒(包括核仁和副斑点)的转录组分析 。值得注意的是,即使标记半径更短,该方法仍保持较高的 RNA 标记效率。μMAP - Seq 可在 10 cm 培养皿中进行,与 APEX - Seq、CAP - Seq 和 Halo - Seq 反应规模相同 。
基于酰化的邻近标记
一种利用酰化的新型 RNA 邻近标记方法 —— 生物正交酰化剂邻近标记(BAP) - Seq 应运而生。该方法使用专门设计的与 RNA 反应的酰化剂,为防止脱靶反应,酰化剂被 1 - 甲基环丙基酯屏蔽,该酯对人或小鼠内源性酯酶有抗性,但可被枯草芽孢杆菌的 BS2 酯酶选择性切割 。当局部表达 BS2 时,酰化剂被激活,实现位点特异性 RNA 标记。处理三分钟后,标记效率与基于 APEX 的方法相当。不过,需优化探针浓度和孵育时间,因为较高浓度和较长处理时间即使在无 BS2 表达时也会增加非特异性信号。
邻近标记与突变分析
即使采用邻近标记,颗粒 RNA 的生化纯化仍可能导致 RNA 大量损失,且需要大量起始材料。对于稀有样本,如组织中的特定细胞类型,研究人员建立了通过核苷酸替换标记颗粒 RNA 的策略,避免对标记 RNA 的纯化。
RNA 结合蛋白编辑靶点识别(TRIBE)技术使用 ADAR RNA 编辑酶的催化结构域 。将 ADAR 的催化结构域与目标蛋白融合,可将结合 RNA 中的腺苷转化为肌苷,测序时肌苷被读作鸟苷,从而揭示与该蛋白相关的 RNA。TRIBE 技术已应用于 FXR1 应激颗粒蛋白研究,助力单细胞颗粒转录组分析 。但该技术的缺点是只要 ADAR 表达,编辑就会持续进行,限制了时间分辨率。为克服这一问题,开发了通过二聚化诱导的 TRIBE(ID)技术,可暂时将 ADAR 招募到标记蛋白上 。利用雷帕霉素驱动的 FKBP 和 FRB 二聚化 ,研究人员可诱导应激颗粒中 ADAR 的瞬时