脑肿瘤多组学数据的网络分析揭示了改变细胞状态转变的药理学机会

【字体: 时间:2025年02月03日 来源:npj Systems Biology and Applications 3.5

编辑推荐:

  

  

脑肿瘤多组学数据网络分析:揭示细胞状态转变的药物干预新契机


在多形性胶质母细胞瘤(GBM)治疗进展缓慢的背景下,美国纽约州立大学布法罗分校药学院和制药科学系的 Brandon Bumbaca 等人在npj Systems Biology and Applications杂志发表了 “Network analyses of brain tumor multiomic data reveal pharmacological opportunities to alter cell state transitions” 一文。该研究整合多组学数据,构建蛋白 - 蛋白相互作用网络(PPIN)和布尔网络模型,结合机器学习算法,为 GBM 治疗开辟了新思路,对推动细胞状态导向疗法(CSD)发展意义重大。

一、研究背景


GBM 是一种极具侵袭性的脑癌,当前治疗手段效果不佳。标准治疗药物替莫唑胺(TMZ)联合放疗,患者中位生存期仅 15 个月,5 年生存率仅 5%。贝伐单抗、厄洛替尼、吉非替尼及免疫检查点抑制剂等治疗方案,也未能显著改善患者生存状况。治疗失败的关键原因在于肿瘤内高度异质性(ITH)和细胞可塑性。ITH 方面,已有研究通过多种方法对 GBM 进行分类,发现多种分子亚型及相关基因突变与临床结局有关,但具体关系仍待深入探究。细胞可塑性上,GBM 肿瘤细胞具有高干性,多种细胞表型或状态间的转换促使肿瘤自我更新和产生治疗抗性,此前研究虽已识别出 GBM 的主要细胞状态及转换现象,但对其机制的理解尚不完善。

二、研究材料与方法


(一)数据来源


研究使用来自 Wang 数据集的公开 snRNA - seq、bulk RNA - seq 和磷酸化蛋白质组数据,这些数据涵盖 100 例 GBM 患者(研究选用其中 92 例野生型 IDH1 患者样本)的多组学测量和临床信息,用于构建 PPIN。同时,从 GLASS 联盟获取 bulk RNAseq 和临床数据,作为机器学习算法的测试集。此外,研究还使用了来自 MSigDB 的人类标志性基因集进行通路分析。

(二)关键技术路线


  1. 细胞状态分类与患者分组:以 Wang 的 snRNAseq 数据为参考,借助 Seurat 和 CopyKat 等 R 包处理 18 例 wtIDH1 GBM 患者的样本,经质量分析、聚类、差异表达分析等步骤标记细胞。运用 Bisque 包对 74 例无 snRNAseq 数据患者的 bulk RNAseq 样本进行反卷积,结合所有患者数据确定主要细胞状态,将患者分为间充质样(MES - like)、神经祖细胞样(NPC - like)、星形胶质细胞样(AC - like)和少突胶质细胞祖细胞样(OPC - like)四组。
  2. 构建 PPIN 与布尔网络:针对四个细胞状态组,利用 COSMOS 管道,综合分析 bulk RNAseq 和磷酸化蛋白质组数据,构建 PPIN。将四个 PPIN 合并为一个最终的 PPIN,并转化为布尔网络,通过 MaBoSS 进行稳态模拟,确定网络逻辑规则。
  3. 敲除模拟与机器学习:在布尔网络稳态基础上,对每个活跃节点进行单敲除模拟,计算汉明距离并 Z 标准化。以敲除模拟结果为训练集,训练多项逻辑回归、K 近邻(KNN)、随机森林(RF)和 XGBoost 四种机器学习模型,使用 GLASS 数据集的 bulk RNAseq 数据测试模型预测细胞状态的能力,并运用 Shapley 值解释模型。

三、研究结果


(一)生成细胞状态特异性 PPIN


对 Wang 数据集中的 snRNAseq 数据进行单细胞分析,经质量筛选、聚类和标记,确定细胞所属状态。反卷积分析 bulk RNAseq 样本后,患者被成功分为四组(MES - like 49 例、NPC - like 33 例、AC - like 5 例、OPC - like 5 例)。利用 COSMOS 管道构建的四个 PPIN,平均含 65 个节点和 122 条边。各细胞状态 PPIN 在标志性通路蛋白组成上既有共性(如均含较多 G2M 检查点通路蛋白和同种异体排斥通路基因),又有差异(如 PI3K/AKT 和 TNFA/NFKB 信号通路相关蛋白分布不同)。合并四个 PPIN 得到最终网络,含 144 个蛋白质和 380 个相互作用。

(二)稳态分析


将最终 PPIN 转化为布尔网络,用 MaBoSS 模拟稳态。比较四个细胞状态的稳态发现,MES 和 AC 状态相似性最高,且起始细胞状态会影响稳态相似性,体现网络的非线性响应。

(三)计算机模拟敲除实验


从各主要细胞状态的稳态出发进行敲除模拟,发现敲除 TP53 或 PTEN 可使网络趋向 MES 状态,STAT3 敲除则使网络远离 MES 状态趋向 AC 状态。转录因子 E2F1 和 E2F4 对维持 NPC - like 状态至关重要,敲除它们会影响 G2M 通路。不同细胞状态对敲除的敏感性不同,NPC 状态最不稳定,模拟中 68% 的敲除会使其发生状态转变。在 GLASS 数据集中,41%(39/95)的患者在治疗后主要细胞状态发生转变,其中 NPC 状态患者转变比例更高(55%,18/33),进一步证实其不稳定性。

(四)机器学习模型预测 GBM 患者细胞状态


用 Wang 数据的敲除模拟结果训练四种机器学习模型,在 GLASS 数据集测试。XGBoost 在所有模型中表现最佳,但因数据集类别不平衡及布尔模型对某些关键蛋白活性预测的偏差,导致模型对 AC 和 OPC 状态预测效果不佳。

(五)XGBoost 解释为细胞状态转变提供机制假设


运用 SHAP 方法解释 XGBoost 模型,发现 CDK2、HGF 等蛋白是 MES 和 NPC 状态的重要预测因子。对 GLASS 数据集中一名患者的分析显示,治疗过程中 CDK2 和 HGF 状态改变与细胞状态从 NPC 向 MES 转变相关。在 14 例从 NPC 向 MES 转变的患者中,HGF 均从无活性变为有活性,CDK2 则相反;12 例从 MES 向 NPC 转变的患者中,9 例 HGF 从有活性变为无活性,所有患者 CDK2 从无活性变为有活性,这些变化均具有统计学意义。

(六)结合 SHAP 解释与敲除模拟结果


敲除模拟提供了引发细胞状态转变的潜在扰动因素,机器学习模型识别出治疗过程中状态改变的关键蛋白。综合二者发现,转录因子 TFAP2A 敲除可激活 HGF,促使细胞从 NPC - like 向 MES - like 状态转变。已有研究表明,GBM 患者经标准治疗后,TFAP2A 转录结合位点高甲基化,而地西他滨作为低甲基化剂,有望通过增加 TFAP2A 表达,提高 PTEN 活性,预防 MES 状态,成为 CSD 治疗的有效方法。

四、研究结论与讨论


该研究构建的布尔模型定义了 GBM 患者的四种细胞状态,模拟和机器学习分析揭示了细胞状态转变的关键驱动因素,为体外实验验证和拓展模型提供了基础。研究首次将磷酸化蛋白质组测量纳入 GBM 患者 PPIN 构建,为 CSD 治疗提供了潜在药物靶点和理论支持。然而,研究存在局限性。PPIN 模型未考虑肿瘤微环境中免疫细胞等其他细胞类型的影响,未来可拓展多组学管道研究细胞间相互作用。模型主要依赖 bulk 肿瘤样本,单细胞多组学数据虽能更准确反映细胞群体对扰动的反应,但目前单细胞磷酸化蛋白质组测量技术尚不完善。此外,研究缺乏实验数据验证模型预测,后续应开展相关实验,如收集药物处理或基因敲除后的 GBM 细胞时间序列 RNA 测序和蛋白质组测量数据。总体而言,该研究为 GBM 治疗研究提供了重要方向,有望推动 CSD 治疗发展,改善 GBM 患者的治疗现状。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号