早期发育中凝结倾向RNA的综合图谱分析揭示RNA-蛋白质相分离协同调控新机制
《Cell Genomics》:Integrative profiling of condensation-prone RNAs during early development
【字体:
大
中
小
】
时间:2025年11月23日
来源:Cell Genomics 9
编辑推荐:
本刊推荐:研究人员为揭示RNA特征在生物分子冷凝体形成中的作用,通过半提取性和正交有机相分离(OOPS)技术联合分析,鉴定出一类新型凝结倾向RNA(smOOPs)。研究发现smOOPs形成高密度RNA亚网络,编码富含固有无序区域(IDRs)的蛋白质,表明RNA与蛋白质在相分离中存在协同调控。该工作为理解RNA驱动的冷凝原理提供了重要资源。
在细胞生物学研究领域,生物分子冷凝体的形成机制一直是科学家们关注的焦点。这些无膜细胞器通过液-液相分离机制形成,在细胞区室化中发挥关键作用。虽然RNA结合蛋白(RBPs)和RNA都被认为参与冷凝体形成,但RNA特征如何贡献于冷凝体形成仍不完全清楚。特别是在早期胚胎发育过程中,RNA-蛋白质网络如何协调调控基因表达更是悬而未决的问题。
以往研究表明,许多RNP冷凝体中的蛋白质含有固有无序区域(IDRs),能够形成弱多价相互作用,而简单的蛋白质序列或电荷变化就能显著改变其冷凝特性。相反,RNA分子本身也能驱动冷凝,要么作为支架,要么通过RNA-RNA相互作用(RRIs)。最近发现G3BP1作为"RNA冷凝器"促进分子间RRIs稳定应激颗粒,而极长的胞质mRNA能够将FXR1蛋白支架成网络介导信号响应。然而,哪些以及如何的RNA特征通过与其核内不均一核糖核蛋白的相互作用贡献于冷凝体形成和功能,仍然是一个具有挑战性的问题。
为了推进当前对RNA中心冷凝特征的理解,研究人员在《Cell Genomics》上发表了最新研究成果,通过整合定制转录组学分析,识别了一类独特的发育凝结倾向RNA,为理解RNA组装原理提供了系统方法。
研究采用的主要技术方法包括:利用半提取性实验和正交有机相分离(OOPS)技术从小鼠早期胚胎发育三个时间点(naive多能干细胞nPSCs、primed外胚层干细胞pPSCs和Wnt分化的原始条纹祖细胞dPSCs)富集RNA分子;通过RNA原位构象测序(RIC-seq)绘制RNA-RNA空间相互作用;采用杂交链式反应荧光原位杂交(HCR-FISH)验证RNA定位;运用可解释深度学习框架分析RNA序列特征;结合全局iCLIP和POSTAR3数据库分析RNA结合蛋白结合模式。
smOOPs:早期发育中半提取性和OOPS富集的RNA类群
研究人员采用半提取性实验和OOPS相结合的策略,特异性富集RNP组装体中的RNA分子。这两种方法共同提供了识别可能参与冷凝过程的RNA的全面策略。
通过差异表达分析,研究人员在三个发育阶段识别出449、1,328和1,390个高置信度基因,这些基因在半提取性和OOPS样本中均显示明显富集,被统称为smOOPs。其中包含了已知形成冷凝体的RNA,如参与核斑的Neat1、在果蝇中形成胞质 foci 的Dync1h1,以及人类同源物在应激颗粒中富集的Peg3。
smOOPs与已知冷凝体富集RNA数据集交叉分析显示,它们并不属于单一颗粒类型,而是异质性分布在多个冷凝体类别中,特别是在应激颗粒、处理小体(P-bodies)和通过LoRNA方法获得的颗粒中显著富集。这表明smOOPs与生物分子冷凝体中的RNA具有保守特征。
研究发现smOOPs是比非smOOPs更长的RNA,这可能部分贡献了它们的独特性质。通过全局iCLIP验证证实了smOOPs相较于非smOOPs具有更高的RBP占据率。
HCR-FISH实验证实smOOPs形成比非smOOPs更大的foci,表明这些RNA在细胞内的局部区域富集,反映了高局部RNA浓度。虽然这些是单个RNA的清晰可见foci,但不排除它们是占据更大亚细胞区域的异型组装体的一部分。进一步分析发现,仅有36.9%的测试smOOPs foci是核内的,而非smOOPs转录本为46.5%,表明smOOPs具有独特的亚细胞分布特征。
鉴于RBPs在调节RNA组装中的明确作用,研究人员假设smOOPs参与更广泛的RNA网络。通过RIC-seq绘制转录组范围内的分子内和分子间RNA邻近性,在nPSCs和pPSCs中捕获直接和间接RBP相关的RRIs。
研究发现,推断的网络显示出生物网络的典型特征,具有尺度自由性和小世界特性。smOOPs亚网络在多个网络连接性指标上表现出高度连接性,且这种连接性不能仅用它们的度来解释。尽管smOOPs的身份在发育过程中发生变化,但这种特征在nPSCs和pPSCs中都得以保持,反映了特定的网络组织,表明它们在细胞中的邻近性。
为了深入研究生化特性定义的smOOPs的RNA特征,研究人员开发了可解释的深度学习方法,利用内在RNA特征和转录组范围内的反式作用因子数据,区分smOOPs与背景RNA群体。
深度学习架构包含多个卷积神经网络(CNN)块、循环神经网络(RNN)和多层感知器(MLP)用于分类。转录本长度单独实现了良好的基线性能,但仅基于序列数据的DL模型大大提高了预测准确性,表明序列特异性特征为准确区分smOOPs提供了关键信息。
研究发现序列、POSTAR3 peaks、全局iCLIP和PARIS-Intra层显著提高了模型性能,而RNAfold预测由于仅编码最优结构的二进制编码、自由能最小化算法对长序列预测二级结构的能力有限以及缺乏上下文特异性信息而引入噪声,降低了性能。
为了提取区分smOOPs的独特特征,研究人员使用积分梯度计算了针对前四个数据集的核苷酸分辨率特征重要性分数。通过将smOOPs转录本分成100个bins并在每个bin内平均特征重要性分数,跨数据集捕获模式,基于特征重要性维度对smOOPs进行聚类,揭示了两个簇。
簇1主要包含mRNAs,在整个转录本中表现出明显的胞嘧啶富集,而簇2是TECs、mRNAs和lncRNAs的混合,显示尿苷重要性增加。尽管全局RBP占据是所有smOOPs的关键特征,但分析揭示了每个簇中RBP结合的位置特异性。
研究发现,smOOPs编码的蛋白质含有更高比例的固有无序区域,且这些蛋白质平均大小是非smOOPs组的两倍以上,导致显著更长的IDRs。通过PICNIC预测模型进一步证明,smOOPs编码的蛋白质更可能参与冷凝体。
有趣的是,尽管具有共同的结构特性和冷凝潜力,两个簇编码具有不同细胞功能的蛋白质。基因本体分析显示,C-富集簇蛋白质定位于细胞膜和周边,主要参与发育过程,并在蛋白质结合中发挥作用;而A/U-富集簇蛋白质主要是核内的,参与基因调控并含有核酸结合域,特别是锌指 motif。
本研究通过双方法学—半提取性实验和OOPS—定义了基于早期小鼠胚胎发育过程中共享生化特性的smOOPs。这种组合提供了可能参与RNP组装和冷凝的RNA的全面视图。
最显著的发现是smOOPs的RNA序列特征与其编码蛋白质中IDRs存在之间的关联。无序蛋白质区域往往由重复核苷酸或序列 motif 编码,使得序列重复性通过密码子偏好得到加强。研究表明两个smOOPs簇都比非smOOPs编码显著更高比例的具有IDRs的蛋白质,但两个簇在核苷酸和氨基酸组成上存在差异,这可能有助于其编码蛋白质的独特功能。这一发现暗示了RNA身份与其编码蛋白质的相分离潜力之间可能存在协调,这一概念需要进一步系统研究。
尽管早期研究已经检验了RNA或RBPs在冷凝中的作用,但本研究通过识别和表征一个具有相分离潜在影响的全新RNA类别,采取了更广泛的方法。这一资源和发现为未来研究奠定了基础,旨在确认smOOPs在冷凝中的参与,阐明两个已识别簇的功能相关性,以及揭示RNA特征可能如何与蛋白质无序和相分离潜力协调的机制。
在方法论方面,研究证明了可解释机器学习在揭示跨不同数据集的复杂模式方面的力量,实现了基因组的无偏分类和表征。这在冷凝体研究中特别有价值,因为使用传统方法区分不同组装体和RNA功能具有挑战性。通过将RNA邻近连接数据集整合到基于网络的分析中,提供了一种方法来揭示组织特定RNA网络特征的新见解,有助于理解蛋白质-RNA冷凝体。
总体而言,这项研究为理解细胞组织和功能中RNA身份与蛋白质冷凝潜力之间的复杂相互作用开辟了新途径,将smOOPs定位为冷凝过程调控的潜在参与者。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号