单细胞转录组与人工智能驱动的ccRCC干细胞特征:预后与治疗反应预测新范式
《Hormones & Cancer》:Single-cell transcriptomic insights into ccRCC: a stemness gene signature for prognosis and treatment response prediction
【字体:
大
中
小
】
时间:2025年10月17日
来源:Hormones & Cancer
编辑推荐:
本研究针对透明细胞肾细胞癌(ccRCC)显著的瘤内异质性给精准预后判断和治疗分层带来的挑战,通过整合44例ccRCC样本的单细胞RNA测序(scRNA-seq)数据和先进的人工智能(AI)分析框架,构建了一个新型干细胞相关基因特征(SGS)。研究发现了一个与不良临床结局密切相关的增殖性上皮细胞亚型,并开发出基于LASSO-XGBoost机器学习算法的预后模型。该模型在多个独立队列中展现出卓越的预测性能,能有效区分高危和低危患者,并预测患者对靶向治疗和免疫检查点抑制剂的反应差异,为ccRCC的精准医疗提供了重要工具。
肾脏作为人体重要的排泄和调节器官,其发生的恶性肿瘤——肾细胞癌(RCC)占据了肾脏癌症的约85%。其中,透明细胞肾细胞癌(ccRCC)是最主要的亚型,约占RCC病例的75%。虽然早期ccRCC可通过手术切除获得较好疗效,但晚期ccRCC却表现出高转移潜能,导致IV期患者的五年总生存率不足19.7%。更复杂的是,ccRCC具有显著的瘤内异质性,这使得精准预测患者预后和制定有效治疗方案变得异常困难,特别是免疫疗法在晚期病例中的疗效仍然有限。
面对这一挑战,科学家们开始将目光投向能够解析单个细胞基因表达特征的技术——单细胞RNA测序(scRNA-seq)。这种技术如同给肿瘤组织中的每个细胞装上"监控摄像头",能够揭示传统批量转录组分析无法发现的细胞亚群。然而,从海量的单细胞数据中准确识别稀有细胞群体并理解其临床意义,需要更强大的分析工具。
与此同时,人工智能(AI)技术的迅猛发展为解决复杂医学问题提供了新思路。机器学习和深度学习算法能够处理大规模临床数据,在预测建模和聚类任务中展现出惊人效率。正是基于这样的背景,Jianhui Chen、Xinyi Wu、Guo Han和Chao Xu研究团队开展了一项创新性研究,他们将单细胞转录组学与先进AI分析框架相结合,试图揭开ccRCC进展的新机制,并开发更精准的预后预测工具。
为了开展这项研究,研究人员采用了几个关键技术方法:首先,他们对44例ccRCC样本进行了单细胞RNA测序分析,使用Seurat R软件包对53,045个细胞进行质量控制、归一化处理和细胞类型注释,识别出成纤维细胞、髓系细胞、T/NK细胞、内皮细胞、B细胞和上皮细胞等六大群体。其次,他们利用CytoTRACE算法评估恶性细胞的干细胞特性,计算细胞分化状态相关的CytoTRACE分数。第三,研究团队从TCGA、GEO和ArrayExpress数据库收集了1,075例ccRCC患者的批量转录组和临床数据,包括接受舒尼替尼(sunitinib)、阿特珠单抗(atezolizumab)+贝伐珠单抗(bevacizumab)、依维莫司(everolimus)或纳武利尤单抗(nivolumab)治疗的患者队列。最重要的是,他们开发了一个集成12种算法、包含184种算法组合的AI驱动网络,通过LASSO-XGBoost机器学习方法构建干细胞相关基因特征(SGS)预后模型。
3.1 干细胞相关基因的鉴定
研究人员首先对scRNA-seq数据进行了聚类分析,共识别出43个不同的细胞簇,并对其进行了系统注释。其中,上皮细胞被进一步细分为10个亚群。为了探究干细胞特性,他们分离了恶性和正常细胞进行聚类分析,并为每组恶性和正常组织分配了干细胞分数。
通过这一分析,研究团队鉴定出一组与干细胞特性相关的基因,其中显示了与干细胞特性最正相关和最负相关的20个基因。京都基因与基因组百科全书(KEGG)和基因本体论(GO)富集分析表明,这些基因参与多种生物过程,包括内吞作用、活性氧(ROS)介导的化学致癌作用和氧化磷酸化。此外,对TCGA数据库中ccRCC患者干细胞相关基因遗传改变的评估显示,24.3%(95/391)的病例存在突变。前20个突变的干细胞相关基因中,PCK1、ATP1B1、MAP1B、ALB、FMO1、MKKS和PLG的突变频率最高(各2%),其余13个基因的突变频率约为1%。
3.2 干细胞基因特征(SRSig)的构建与验证
为了开发预后模型,研究人员在TCGA队列中进行了单变量Cox回归分析,识别出具有显著预后相关性的关键干细胞相关基因(p<0.01)。此外,这些基因还需满足在ccRCC组织中的差异表达标准(|log2FC|>0.5,调整后p<0.05)。研究团队在TCGA数据集中测试了总共429种算法组合,并在验证队列中计算了每种算法的C-index。LASSO+XGBoost模型在验证数据集中显示出最高的平均C-index(0.763),因此被选为最终的干细胞基因特征(SGS)。
通过LASSO回归和交叉验证,PLG被确定为SGS中最关键的基因,表明其在疾病进展和生存预测中的潜在重要性。研究人员根据TCGA队列中的最佳SGS阈值将患者分为高风险组和低风险组。在所有队列中,高风险组患者的总生存期显著差于低风险组(p<0.05)。时间依赖性受试者工作特征(ROC)曲线分析证实了SGS在所有验证数据集中的一致且稳健的预后准确性。
3.3 干细胞基因特征(SGS)的比较
为了进一步验证干细胞基因特征(SGS)的预后价值,研究人员评估了其与TCGA数据集中生存状态、肿瘤分期和TNM分类的相关性。发现SGS与这些临床参数呈显著正相关。基于所有数据集的C-index比较,SGS优于年龄、性别、肿瘤分期和TNM分期等传统临床因素。此外,SGS还与来自TCGA、GSE22541、GSE167573和E-MTAB-1980队列的101个其他预后特征进行了比较。值得注意的是,SGS在所有验证数据集中 consistently 获得了最高的C-index,强调了其作为ccRCC患者可靠预后生物标志物的潜力。
3.4 SGS对靶向和免疫治疗反应的预测价值
为了确定SGS是否能预测靶向治疗和免疫治疗的反应,研究人员在相关患者队列中进行了Kaplan-Meier(KM)生存分析。无论治疗类型如何,高风险组患者的预后均显著差于低风险组(所有p<0.05)。具体而言,SGS能够预测患者接受以下治疗后的结局:舒尼替尼(sunitinib)、阿特珠单抗(atezolizumab)+贝伐珠单抗(bevacizumab)、依维莫司(everolimus)和纳武利尤单抗(nivolumab)。这些发现表明,SGS评分较低的患者更可能从靶向治疗和免疫检查点抑制剂中获益。
3.5 SGS在多种癌症类型中的广泛适用性
为了探索SGS的更广泛临床相关性,研究人员估算了TCGA数据库中33种不同癌症类型的SGS评分。根据SGS评分将患者分为高风险组和低风险组,并评估了其预后影响。分析显示,在9种癌症类型中,较高的SGS评分与较差的预后显著相关。这些发现突出了SGS作为跨多种恶性肿瘤的通用预后生物标志物的潜在效用。
3.6 细胞通讯分析
研究人员计算了每个主要细胞亚群的SGS评分,并通过小提琴图进行了可视化。细胞组成分析显示,上皮细胞在低风险组中富集,而免疫成分——包括B细胞、T/NK细胞和髓系群体——的占比减少。值得注意的是,高风险组中促肿瘤信号级联反应上调,特别是SELL、LCK和CD70通路。
这项研究通过整合ccRCC和正常肾组织的单细胞RNA测序数据,构建了一个全面的转录组框架,促进了对TCGA队列批量RNA测序数据中细胞类型的解析。研究团队识别出一个具有显著增殖能力且与ccRCC密切相关的增殖性上皮细胞亚型,这些细胞的存在与较差的生存结局密切相关。对scRNA-seq数据集中鉴定的增殖细胞特异性标记基因的分析表明,它们在TCGA队列中的高表达与不良预后相关。
最重要的是,研究人员开发了SGS这一创新性预后特征,它通过关键基因表达谱量化增殖性上皮细胞的丰度,并利用基于新型人工智能(AI)网络改进生存预测。这一网络整合了传统回归、机器学习和深度学习中的11种算法,超越了先前机器学习框架的预测性能。值得注意的是,LASSO+XGBoost组合成为最佳预测模型。ROC和C-index分析证实了SGS在所有四个验证队列中的强大预后能力,强调了其临床应用的潜力。
特别重要的是,在多个队列中——包括接受舒尼替尼、依维莫司、纳武利尤单抗或阿特珠单抗加贝伐珠单抗治疗的患者——高SGS评分患者在治疗后均未显示预后改善。这一发现表明迫切需要新的治疗策略,并暗示当前的药理学干预可能对增殖性细胞群体无效。
该研究的局限性包括研究队列的异质性,这源于使用不同的测序和微阵列平台。尽管应用了标准化技术来减轻这些差异,但它们对研究结果的潜在影响仍需仔细考虑。未来的研究将侧重于在更大的ccRCC患者队列中验证SGS,并通过体内和体外实验研究其潜在机制。这些努力不仅将确认其预后价值,还将探索其在指导个性化治疗策略中的作用。
总之,这项研究为ccRCC精准医疗领域提供了宝贵贡献,提供了关于上皮细胞相关基因表达及其在分层ccRCC患者以进行个性化治疗方法应用的新见解。研究建立的干细胞基因特征不仅深化了对ccRCC肿瘤异质性的理解,而且为临床预后判断和治疗决策提供了实用工具,标志着单细胞技术与人工智能算法在肿瘤研究中的成功融合,为未来类似研究提供了可借鉴的分析框架。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号