凝聚态蛋白质的集体稳态调控:mRNA介导的核内相分离新型反馈机制——interstasis的发现
【字体:
大
中
小
】
时间:2025年09月26日
来源:Nature 48.5
编辑推荐:
本文揭示了一种称为"interstasis"的新型稳态机制,该机制通过RNA-蛋白质凝聚体(nuclear speckles)选择性捕获自身mRNA,实现对固有无序区域(IDR)蛋白的集体负反馈调控。研究发现遗传密码结构和保守密码子偏好确保了低复杂度结构域(LCD)与多价RNA区域的编码对应关系,其中精氨酸富集的混合电荷结构域(R-MCD)由mRNA中重复的嘌呤富集序列编码。该机制涉及TRA2蛋白的重新定位和CLK激酶介导的磷酸化修饰,为理解核内凝聚体(biomolecular condensates)的剂量敏感性调控提供了新范式。
广义RNA多价性评分识别编码低复杂度结构域的密码子偏好性多价区域
研究人员开发了广义RNA多价性(GeRM)评分算法,用于量化转录本中相似k-mer的聚集程度。该算法通过计算每个k-mer与周围k-mer的序列相似性(加权距离函数),识别出高度多价的RNA区域。分析显示,人类蛋白质编码基因的编码序列(CDS)中存在显著的多价区域,这些区域与低复杂度结构域(LCD)的编码密切相关。例如,LUC7L3基因的mRNA包含一个GA富集的GeRM区域,该区域专门编码带电氨基酸。
研究发现,GeRM区域编码的氨基酸序列熵值显著低于蛋白质其他区域,且AlphaFold2预测表明这些区域倾向于形成固有无序区域(IDR)。密码子洗牌实验证实,LCD编码区域的RNA多价性受到密码子使用偏好的强化,特别是在精氨酸等氨基酸的密码子选择上。进化分析表明,增强多价性的密码子选择在脊椎动物中高度保守,提示存在功能选择压力。
精氨酸密码子使用分析揭示了两种不同的偏好模式:GA富集型(AGA、AGG、CGA)和CG富集型(CGG、CGC)。GA富集型密码子倾向于编码带正电荷的混合电荷结构域(R-MCD),而CG富集型则更多编码富含脯氨酸、丙氨酸和甘氨酸的LCD。这种密码子偏好与蛋白质功能密切相关:GA富集型R-MCD蛋白显著富集在核斑点和RNA结合相关功能中。
跨物种比较显示,这种密码子偏好模式在羊膜动物(爬行动物、鸟类和哺乳动物)中最为明显,而在两栖动物和更早分支的物种中较弱,表明在陆地脊椎动物进化过程中逐渐强化。
通过UMAP降维和聚类分析,研究人员将GeRM区域分为多个功能类别:GA富集型(进一步分为腺嘌呤偏倚、鸟嘌呤偏倚和胞嘧啶掺杂亚型)、GC富集型、CAG重复型和C富集型等。每种类别编码特定类型的LCD,并与不同的生物学功能相关:GA富集型主要与核RNA调控和染色质相关功能有关;GC富集型与转录因子相关;C富集型与SH3结构域和肌动蛋白结合相关。
精氨酸密码子使用分析表明,R-MCD可分为GA富集型和CG富集型。GA富集型R-MCD富含带电氨基酸残基,包括典型的R-MCD,而CG富集型则含有更多脯氨酸、丙氨酸和甘氨酸。功能分析显示,GA富集型R-MCD基因显著富集核斑点定位、mRNA加工和RNA结合等Gene Ontology术语。
为研究R-MCD蛋白积累的效应,研究人员构建了可诱导表达PPIG蛋白LCD结构域(PPIGLCD)的HeLa细胞系。表达PPIGLCD导致核斑点数量减少、体积增大,但不影响SC35染色强度,这与R-MCD增强斑点凝聚性的已知效应一致。
核质分离测序显示,PPIGLCD表达随时间增加导致GA富集多价mRNA在核内显著滞留,且滞留程度与GA多价性评分正相关。脉冲SILAC实验证实,GA富集mRNA的核滞留导致其编码蛋白的合成减少。
通过HCR-FISH技术直接观察,发现PPIGLCD表达以剂量依赖方式促进五种GA富集多价mRNA(而非对照mRNA)在核斑点中的滞留。这种效应也出现在其他R-MCD蛋白(LUC7L3、PRPF38B和SRSF11)过表达时,但对其他类型LCD蛋白不敏感。定量分析表明,细胞总R-MCD蛋白丰度增加15%即足以诱导选择性mRNA滞留。
研究人员通过密码子工程改造LUC7L3的R-MCD编码序列,创建了GA多价性高/低但GC含量相同的版本。当这些序列作为mGreenLantern报告基因的3'UTR时,高GA多价性版本在PPIGLCD表达时呈现更强的表达抑制,证实了mRNA多价性在介导互稳态中的核心作用。
核滞留mRNA编码的蛋白质具有显著特征:富含IDR、带电荷氨基酸比例高、结构无序性强。这些基因在功能上富集核斑点、染色质重塑、RNA结合和加工等术语,且具有双向剂量敏感性(单倍体不足和三倍敏感)。gnomAD数据分析显示,这些基因具有更高的突变限制性,DosPS评分也表明其相分离倾向更强。
研究人员通过随机森林建模发现,CDS长度、平均外显子长度、GA富集和CAG富集多价性四个特征最能预测mRNA在互稳态中的核滞留响应。其中CDS长度预测能力最强(AUROC=0.83),其他特征进一步改善模型性能。
外显子连接复合体(EJC)沉积可能限制多价RNA序列的可及性。分析表明,靠近EJC结合区域的GA富集多价序列其核滞留能力较弱。为验证这一假设,研究人员设计了精巧的报告基因库系统:保持CDS长度和GC含量恒定,但通过组合装配实现GA多价性和内含子数量(1-8个)的正交变化。
长读长测序证实所有内含子均被有效剪切。报告基因分析显示,高GA多价性转录本的核滞留程度随PPIGLCD表达时间增加而增强,且与外显子数量负相关:外显子少(外显子长)的转录本核滞留显著,而外显子多(外显子短)的转录本即使GA多价性高也不易滞留。这表明EJC介导的mRNP包装可抵消多价RBP组装的作用。
通过分析报告基因序列与RBP结合潜能的相关性,发现GA多价性与核斑点蛋白TRA2A(r=0.97)和TRA2B(r=0.95)的结合潜能高度相关。公共CLIP数据分析表明,34种RBP偏好结合多价环境中的靶motif,其中GA富集GeRM区域被多种核斑点RBP结合,尤以TRA2蛋白富集程度最高。
TRA2B iCLIP实验证实其强烈结合CDS中的GA富集GeRM区域,且结合位点常包含剪接连接点,表明TRA2B在剪切后仍与多价位点结合。虽然TRA2蛋白以调控选择性剪切闻名,但互稳态相关的GA多价外显子在不同组织中均为组成型外显子,且TRA2敲除不影响其包含性。
重要的是,TRA2B的亚细胞定位受R-MCD剂量调控:在无PPIGLCD表达时弥散分布于核质,随PPIGLCD表达增加而逐渐富集于核斑点。TRA2A/B双敲除实验证明,在低PPIGLCD水平下,TRA2蛋白是GA富集mRNA斑点滞留的主要效应器;而在高R-MCD浓度下,其他RBP也可能参与这一过程。
通过构建LUC7L3 R-MCD的密码子工程版本,发现只有当R-MCD作为蛋白质表达时才驱动TRA2B重定位,作为3'UTR序列时无此效应,证实是R-MCD蛋白质而非其mRNA驱动了TRA2B的重新定位。
SR蛋白的核内分布受CLK激酶家族磷酸化调控。使用选择性CLK抑制剂(CLK-IN-T3)处理细胞导致TRA2B和其他SR蛋白去磷酸化,引发TRA2B强烈重定位至核斑点,并伴随轻微的整体poly-A+ mRNA核滞留增加。长期CLK抑制导致核斑点变大、数量减少。
HCR-FISH显示,CLK抑制特异性增加GA富集mRNA(如EIF3A、BRD4)在斑点中的滞留,而对对照mRNA无影响。报告基因实验证实,CLK抑制以序列特异性方式增强GA多价转录本的核滞留。转录组分析表明,CLK抑制与R-MCD过表达引起的mRNA核滞留模式高度相关。
本研究发现的互稳态机制代表了通过蛋白质-RNA凝聚体实现集体反馈调控的新范式。核斑点作为传感器,通过选择性捕获mRNA调控最具剂量敏感性的凝聚倾向蛋白的表达。这种调控依赖于遗传密码的结构特征——物理性质相似的氨基酸具有相似密码子,且密码子偏好进一步强化了这种对应关系。
CLK激酶活性受细胞周期进程和温度变化等生理状态调节,表明互稳态的设定点可能受多种生理信号调控。这一机制可能保护细胞免受IDR蛋白毒性积累的影响,特别是在神经退行性疾病等蛋白聚集疾病中。
研究揭示了核斑点的新功能——作为集体剂量传感器,通过管理最易凝聚的核蛋白,保护斑点免于达到过度凝聚状态。理解凝聚态蛋白质的稳态调控机制,为开发针对异常蛋白凝聚疾病的治疗策略提供了新视角。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号