编辑推荐:
激酶在细胞调控和疾病中至关重要,从磷酸化蛋白质组数据推断激酶活性的方法虽多,但存在底物覆盖有限、方法间结果差异大等问题。研究人员开发 R 包 benchmarKIN,结合扰动和肿瘤多组学数据评估,发现方法性能相近,文库选择影响结果,添加预测底物可提升性能。
在生命科学和医学研究中,激酶(Kinase)作为细胞信号传导的关键调控分子,其异常活性与癌症、神经退行性疾病等多种重大疾病密切相关。从磷酸化蛋白质组数据中准确推断激酶活性,对于理解细胞功能、揭示疾病机制及开发靶向疗法至关重要。然而,当前依赖激酶 - 底物文库的推断方法面临两大挑战:一是文库中可归因于上游激酶的磷酸化位点有限,导致激酶活性推断范围受限;二是不同方法推断结果差异显著,亟需系统性评估以指导方法选择。在此背景下,德国海德堡大学(Heidelberg University)等机构的研究人员开展了相关研究,其成果发表在《Nature Communications》,为激酶活性推断提供了重要的方法学指导和资源支持。
为解决上述问题,研究团队开发了名为 benchmarKIN 的 R 包,整合两种互补的基准测试策略,对激酶活性推断方法及激酶 - 底物文库进行全面评估。研究使用的关键技术方法包括:基于细胞的激酶扰动实验(涵盖 230 个实验,涉及约 80 种激酶)、基于肿瘤多组学数据(CPTAC 的蛋白质组和磷酸化蛋白质组数据,包含 7 种癌症类型)的基准测试、多种计算方法(如 z-score、KSEA、PTM-SEA 等)以及激酶 - 底物文库(包括手动 curated 文库 PhosphoSitePlus、PTMsigDB、GPS gold,预测文库 NetworKIN 等)。
研究结果
1. 扰动实验基准测试:方法性能与文库选择
通过分析 230 个扰动实验,研究发现多数计算方法(如 z-score、KSEA、PTM-SEA)性能相近。其中,z-score 方法表现最优,平均 AUC 为 0.79,在预测扰动激酶排名中具有较高准确性。同时,激酶 - 底物文库的选择显著影响推断结果:手动 curated 文库(PhosphoSitePlus、PTMsigDB、GPS gold 组合)在重现激酶活性方面表现 superior,而包含预测底物的 NetworKIN 文库在肿瘤基准测试中可提升性能。此外,丝氨酸 / 苏氨酸激酶的推断性能优于酪氨酸激酶,可能与磷酸酪氨酸位点检测不足有关。
2. 肿瘤多组学基准测试:整合蛋白水平与激活位点
利用 CPTAC 的 7 种癌症多组学数据,研究定义了基于激酶蛋白水平(top/bottom 5%)和激活位点水平的金标准集。结果显示,手动 curated 文库结合 z-score 方法在区分高 / 低活性激酶方面表现良好(AUC 约 0.66-0.67),而基于激活位点的金标准集因更直接反映激酶活性,AUC 略高(约 0.71-0.72)。值得注意的是,归一化磷酸化位点至宿主蛋白水平的策略会降低性能,提示蛋白数据中已包含与激酶活性相关的信号。
3. 文库组合与预测底物的作用
测试多种文库组合发现,手动 curated 文库与 NetworKIN 预测底物结合可扩大激酶覆盖范围,并在肿瘤基准测试中提升性能(AUC 从 0.668 升至 0.689),而 iKiP-DB 等体外文库因包含非生理底物导致性能下降。进一步分析表明,激酶底物数量影响推断准确性:中等底物数量的激酶性能最佳,而底物丰富的激酶在肿瘤数据中表现更优。
4. 激酶活性与药物响应的关联
在 NCI60 细胞系中,结合 NetworKIN 预测底物的 z-score 方法推断的激酶活性,与激酶抑制剂响应的相关性显著优于单纯蛋白水平。例如,CDK4 活性评分与 Palbociclib 响应呈负相关,而蛋白水平呈正相关,表明活性评分更能反映药物敏感性。这一发现为精准肿瘤学中激酶抑制剂的应用提供了潜在生物标志物。
结论与意义
本研究通过系统性评估,揭示了激酶活性推断中方法、文库和数据类型的影响机制,证实手动 curated 文库结合预测底物(如 NetworKIN)和 z-score 方法的优越性。开发的 benchmarKIN 工具为研究人员选择可靠的激酶活性推断方法提供了标准化流程,其整合的多组学基准测试策略填补了肿瘤环境下激酶活性评估的空白。此外,研究强调激酶激活位点和蛋白水平的互补性,为生物标志物开发和靶向疗法设计提供了新视角。该成果不仅推动了磷酸化蛋白质组学的方法学进步,也为理解激酶在疾病中的作用及精准医学应用奠定了重要基础。