编辑推荐:
本文介绍一种基于蛋白质表达的干性指数(PROTsi)。其可评估肿瘤的致癌去分化程度,通过整合多组学数据,揭示与干性相关的分子特征和潜在药物靶点,为个性化抗癌治疗提供关键依据,助力癌症临床治疗发展。
基于蛋白质组学的干性评分衡量致癌去分化并识别可成药靶点
肿瘤的进展和对治疗的抵抗与癌症细胞的干性表型密切相关。在本研究中,科研人员引入了一种基于蛋白质表达的干性指数(Protein-expression-based stemness index,PROTsi),旨在从组织病理学、分子特征以及临床结果等多个维度评估肿瘤的致癌去分化程度。
- PROTsi 的构建与验证:研究人员利用来自 207 个基因多样的非转化诱导多能干细胞(iPSCs)的蛋白质组数据,通过基于一类逻辑回归(OCLR)的机器学习算法,提取干性特征,进而构建出 PROTsi 模型。该模型生成的 PROTsi 分数范围从低(0)到高(1),用以表示肿瘤的干性程度。在多个独立数据集中,PROTsi 展现出了良好的性能,能够清晰地区分干细胞(如胚胎干细胞、iPSCs)和分化细胞,并且在不同肿瘤类型中呈现出合理的分层。将 PROTsi 应用于超过 1300 个来自 11 种原发性肿瘤的 CPTAC 样本后发现,大多数肿瘤的干性评分高于非肿瘤样本。例如,基底型乳腺癌(BR)和世界卫生组织分级 IV 的非典型畸胎样 / 横纹肌样肿瘤(ATRT)等具有侵袭性表型的肿瘤,其 PROTsi 分数较高。此外,PROTsi 还与肿瘤的恶性程度和病理分期相关,并且在部分肿瘤类型(如头颈部鳞状细胞癌(HNSCC)、子宫体子宫内膜癌(UCEC)和透明细胞肾细胞癌(CCRCC))中能够预测临床结果。同时,PROTsi 与已发表的基于转录组学的干性评分(如 mRNAsi.2018)呈正相关,但在区分肿瘤和非肿瘤样本以及某些肿瘤类型的不同分级方面,PROTsi 表现更优。
- 干性相关蛋白及多组学分析:通过将 PROTsi 与多组学数据(包括拷贝数变异(CNV)、DNA 甲基化、mRNA、微小 RNA(miRNA)和蛋白质表达)整合,研究人员鉴定出了与干性密切相关的蛋白质。在每种癌症中,都筛选出了 12 个与干性正相关和 12 个负相关的代表性蛋白质,并对这些蛋白质的蛋白基因组特征进行了深入探究。一般来说,与 PROTsi 正相关的蛋白质,其 mRNA 表达和 CNV 也与 PROTsi 呈正相关,而靶向相应基因的 miRNA 则呈负相关。此外,一些干性相关蛋白具有预后意义,其表达水平与患者的生存风险相关,且部分蛋白的预后价值无法通过基因表达来体现,凸显了蛋白质生物标志物的优势。研究人员还利用独立数据集对 PDA 和 LUAD 进行了外部验证,结果进一步证实了 PROTsi 在识别生物学相关关联方面的可靠性和通用性。
- PROTsi 与蛋白翻译后修饰(PTMs)的关联:许多 PTMs 与肿瘤的进展、生长和存活密切相关。研究人员对 CPTAC 肿瘤中干性与 PTMs(如乙酰化、糖基化和磷酸化)之间的关系进行了研究。发现多种高干性肿瘤共享一些与干性相关的修饰位点,如乙酰化、N - 连接聚糖和磷酸化位点。例如,在 BR、GBM、LSCC、LUAD 和 UCEC 中,发现了 71 个与干性正相关的共享乙酰化位点,其中聚(ADP - 核糖)聚合酶 1(PARP1)在 K105 和 K108 位点的乙酰化在所有肿瘤中均有鉴定,这表明乙酰化的 PARP1 可能促进癌症干细胞(CSCs)的存活和治疗抗性。此外,还发现了一些特定肿瘤中独特的修饰位点,这暗示了不同癌症中修饰特异性的干性调节机制。通过对修饰蛋白的分析,发现一些修饰蛋白在不同肿瘤中共享,但在特定肿瘤类型中富集,如纤连蛋白(FN1)和低密度脂蛋白受体相关蛋白 1(LRP1)的糖基化与高干性的 CCRCC 密切相关。
- 激酶活性与干性的关系:研究人员将从磷酸蛋白质组数据中获得的激酶活性评分与 PROTsi 进行整合,以发现与干性相关的最活跃和最不活跃的蛋白激酶。结果显示,来自 CMGC、CK1 和非典型家族的激酶,以及其他家族的大多数激酶和部分 CAMK 家族激酶与干性呈正相关,这些激酶在高干性肿瘤中表现出较高的活性。例如,细胞周期蛋白依赖性激酶(CDK)家族的 CDK1、CDK2、CDK7 等,它们参与细胞周期的调控,这可能解释了它们与干性的高度关联,因为 CSCs 具有增强的增殖潜力。相反,来自 TKL、CAMK、AGC、TK 和 STE 家族的激酶总体上与干性呈负相关。其中,一些已知的肿瘤发生驱动因子,如表皮生长因子受体等,在高干性肿瘤中的失活可能与化学抗性或非遗传机制的药物耐受性有关。此外,一些与干性高度相关的激酶,如 CHEK1 和 Haspin,已被测试作为靶向治疗的潜在靶点,相关抑制剂在临床前或临床试验中展现出了一定的前景。
- 蛋白质相互作用网络和信号通路分析:通过蛋白质 - 蛋白质相互作用分析,研究人员发现干性相关蛋白之间存在复杂的相互作用网络。使用 Cytoscape 和 STRING 数据库对 700 个与干性最相关的蛋白质进行分析,发现这些蛋白质形成了一个紧密相连的 “主” 网络,其中上调和下调的蛋白质集均表现出大量的相互作用。同时,一些下调的蛋白质虽然与主网络分离,但也发挥着重要作用,如 IRF6 在 CCRCC 中虽呈下调状态,但通过与 SMARCA4 相互作用影响基因表达和染色质结构。通过通路分析,鉴定出了与癌症干性相关的关键生物学通路,包括细胞周期调节、DNA 修复、免疫反应以及 mRNA 剪接和加工等。其中,mRNA 剪接和加工通路在多个肿瘤中均有富集,表明其在干性特征的转录后调控中具有重要作用。此外,还发现了一些肿瘤特异性的通路,如 CCRCC 中的过氧化物酶体脂质代谢通路,这与该肿瘤的已知病理生物学特征相符。
- 潜在抑制剂的鉴定:通过药物连通性分析,研究人员利用 CMap(Connectivity Map)数据库,对每种肿瘤类型中与干性最正相关和最负相关的 100 个蛋白质进行分析,以识别可能抑制干性的扰动剂(如小分子药物或化合物)。结果发现了一些在多种癌症类型中共同的化合物,如 CGP - 60474,以及一些针对特定癌症类型的化合物,如 prostratin 和 teniposide。这些化合物中,部分已在临床前或早期临床试验中进行了研究,如泛蛋白激酶 C(PKC)抑制剂 bisindolylomaleimide - IX(Ro 31 - 8220)在乳腺癌和非小细胞肺癌的临床前研究中展现出了潜力;组蛋白去乙酰化酶(HDAC)抑制剂 vorinostat 已被批准用于治疗皮肤 T 细胞淋巴瘤,并且在非小细胞肺癌的临床试验中也显示出一定的效果。进一步分析发现,HDACs 是这些潜在抑制剂的最常见靶点,同时还确定了这些抑制剂的作用机制,如 CGP - 60474 作为细胞周期蛋白依赖性激酶抑制剂,可抑制与细胞周期相关的干性表型;topotecan 和 teniposide 作为拓扑异构酶抑制剂,可抑制 UCEC 中与干性相关的通路。
- 免疫组化验证:研究人员使用免疫组化(IHC)方法对通过质谱(MS)鉴定出的与 PROTsi 高度相关的蛋白质进行验证,并在独立的 CCRCC 样本集中探究了这些蛋白质的 IHC 评分与预后的关联。选择了 HEATR1、SNRNP200、UHRF1(与干性正相关)和 SLC27A2(与干性负相关)等蛋白质进行验证,同时对 UCHL1 也进行了分析。结果显示,患者原发性肿瘤中 HEATR1、SNRNP200、UCHL1 和 UHRF1 的高表达与疾病进展的高概率相关,而低表达的 SLC27A2 则与较短的无进展生存期相关。其中,HEATR1 与不良预后的相关性最强。
- 研究意义与展望:PROTsi 的开发为评估癌细胞与干细胞的相似程度提供了一种有效的策略。与以往基于 mRNA 的干性指数相比,PROTsi 基于蛋白质组学,能够更直接地反映细胞的功能状态,因为蛋白质水平和活性受到多种转录后和翻译后调控机制的影响,与 mRNA 水平并不总是呈线性关系。PROTsi 在预测临床结果、识别预后生物标志物和潜在药物靶点方面具有显著优势,有助于推动个性化抗癌治疗的发展。然而,该研究也存在一定的局限性,如肿瘤类型覆盖范围有限,机器学习方法需要进一步验证,以及 IHC 验证中使用的研究抗体可能影响结果的可靠性等。未来的研究需要进一步扩大样本量,深入探究 PROTsi 在更多癌症类型中的应用,并进行严格的实验验证,以充分挖掘其在癌症治疗中的潜力。}