RAPDOR:基于Jensen-Shannon距离的复杂蛋白质组学数据集计算分析工具及其在RNA结合蛋白鉴定中的应用

【字体: 时间:2025年09月27日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对梯度分析和空间蛋白质组学中复杂数据计算分析的瓶颈问题,开发了非参数化工具RAPDOR。该工具基于Jensen-Shannon距离(JSD)和相似性分析(ANOSIM),能够准确识别RNase敏感蛋白复合物。通过在集胞藻Synechocystis 6803中鉴定出165个潜在RNA结合蛋白(RBPs),并实验验证了包括核糖体休眠因子LrtA/RaiA、磷酸葡萄糖变位酶Sll0726等新型RBPs,为原核生物RNA调控机制研究提供了新视角。工具成功应用于HeLa细胞空间蛋白质组学数据分析,展现了跨物种应用的通用性。

  
在生命科学领域,RNA结合蛋白(RBP)作为基因表达调控的关键参与者,在核糖核蛋白复合物(如核糖体、剪接体和CRISPR-Cas系统)中发挥着不可或缺的作用。尽管真核生物中已有超过6300个RBP直系同源群组被鉴定,但原核生物尤其是蓝细菌中,完整的RBP谱系仍然未知。传统实验方法如Grad-Seq(梯度测序)虽能揭示蛋白质与RNA的共分布,但无法区分直接相互作用与间接关联。此外,现有计算工具如R-DeeP依赖高斯分布假设和峰值识别,在处理非标准分布和高噪声数据时存在局限,且对重复实验的分析能力不足。
针对这些挑战,由弗莱堡大学Wolfgang R. Hess和Rolf Backofen领导的研究团队开发了RAPDOR(Rapid ANOSIM using Probability Distance)——一种基于Jensen-Shannon距离(JSD)和相似性分析(ANOSIM)的非参数化计算工具。该工具能够高效分析梯度分析(如GradR)和空间蛋白质组学产生的复杂数据集,无需预设分布模型即可识别蛋白质分布的变化。研究成果发表于《Nature Communications》,为原核生物RBP鉴定提供了新方法,并揭示了蓝细菌中新型RNA相互作用蛋白。
关键技术方法包括:1)基于蔗糖密度梯度的GradR实验设计(3个生物学重复);2)LTQ Orbitrap Velos Pro质谱技术进行蛋白质定量;3)非参数统计方法ANOSIM和JSD算法;4)TriPepSVM机器学习预测模型;5)体内PNK(多核苷酸激酶)放射性标记验证实验。

研究结果

GradR技术在蓝细菌中的应用

研究团队在模型生物Synechocystis 6803中建立了GradR实验体系。通过RNase处理与对照组的比较,发现核糖体小亚基蛋白普遍向左偏移(向低分子量区域),而大亚基蛋白仅部分发生偏移(如RplA从第20组分移至第4组分),光合系统蛋白则无变化。

RAPDOR工具的性能优势

与R-DeeP相比,RAPDOR在人类HeLa数据集上显示出更高的曲线下面积(AUROC 0.728 vs. 0.69),且能识别R-DeeP遗漏的分布变化(如TIM50蛋白)。其非参数特性避免了对高斯分布的依赖,运行时间仅需6秒(HeLa数据集),大幅优于R-DeeP的2分钟。

Synechocystis 6803中的RBP候选者

通过ANOSIM R值≥0.481的筛选,鉴定出165个潜在RBP,包括29个核糖体蛋白和136个非核糖体蛋白。其中20个高优先级靶标涵盖RNA修饰酶(如RImD同源物Sll1967)、代谢酶(如磷酸葡萄糖变位酶Sll0726)和毒素-抗毒素系统组分(如Ssl2245)。

体内RNA结合验证

通过PNK assay对8个候选蛋白进行验证,其中5个显示阳性信号:Sll1967(23S rRNA甲基转移酶)、Ssl2245(抗毒素)、Slr0711(QueF预Q1合成酶同源物)、Sll0947(RaiA/LrtA核糖体休眠因子)和Sll0726(磷酸葡萄糖变位酶)。Western blot与放射自显影结果证实了它们的RNA结合能力。

空间蛋白质组学应用

在EGF刺激的HeLa细胞数据重分析中,RAPDOR成功识别出蛋白质亚细胞重分布(如GRB2、CBL和SHC1在2/8分钟的招募),并发现原始分析遗漏的靶标(如FOXJ3向膜结构富集、ITSN1和MITF向胞质转移)。

结论与意义

本研究开发的RAPDOR工具突破了传统参数化方法的局限,为复杂蛋白质组学数据分析提供了通用、高效的解决方案。其在Synechocystis 6803中鉴定的新型RBPs(如代谢酶Sll0726和抗毒素Ssl2245),揭示了原核生物中RNA结合的广泛性和多样性,为理解细菌的转录后调控网络提供了新视角。工具的成功跨物种应用(从蓝细菌到人类细胞)证明了其广泛适用性,未来可拓展至疾病相关蛋白质分布变化研究。所有数据和分析工具已开源,可通过交互式网络服务器(https://synecho-rapdor.biologie.uni-freiburg.de)访问,推动计算生物学与实验研究的深度融合。
研究强调:1)非参数方法在蛋白质组学中的优势;2)蓝细菌作为光合作用模型在RBP研究中的独特性;3) moonlighting enzyme(兼职酶)的生物学意义;4)计算工具与实验验证结合的重要性。该工作为系统鉴定RNA依赖性蛋白复合物设立了新标准,对微生物学、细胞生物学和计算生物学领域均有深远影响。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号