编辑推荐:
为解决卵巢癌铂耐药可靠预测生物标志物缺乏的问题,研究人员整合 scRNA-seq 与 bulk RNA-seq 数据,开展铂响应预测研究。构建随机森林模型 GPPS,含 5 基因,AUC 达 0.993 等,可预测响应及预后,具重要临床价值。
卵巢癌作为致死率最高的妇科恶性肿瘤,5 年生存率不足 50%,铂类化疗虽为标准治疗核心,却面临大部分患者最终产生耐药、导致难治性疾病的困境。当前,临床缺乏可靠的铂响应预测生物标志物,传统检测手段如 BRCA 突变等虽有一定价值,但存在局限性,无法全面精准预测患者对铂类药物的反应及预后。因此,深入挖掘肿瘤异质性下的分子机制,开发更高效的预测模型,成为提升卵巢癌个体化治疗水平的关键挑战。
来自西安交通大学第一附属医院、空军军医大学第二附属医院等机构的研究人员,针对这一难题开展了相关研究。他们通过整合单细胞转录组测序(scRNA-seq)和批量转录组测序(bulk RNA-seq)数据,并结合机器学习算法,旨在建立一种能准确预测卵巢癌患者铂类化疗响应及预后的模型。研究成果发表在《Scientific Reports》上。
研究主要运用了以下关键技术方法:首先从公共数据库获取卵巢癌患者的单细胞转录组数据(如 GSE165897),通过严格的质量控制(包括过滤细胞中总唯一分子标识符 nUMIs、表达基因数 nGene、线粒体和核糖体基因转录本百分比等指标)和去除 doublet 细胞,筛选出高质量细胞。利用 Seurat 软件进行常规聚类分析,包括过滤、变量基因选择、降维及聚类,并通过 inferCNV 工具基于拷贝数变异(CNV)从上皮细胞中鉴定出恶性癌细胞。对铂敏感和耐药癌细胞进行差异基因分析,使用 MAST 检验筛选差异表达基因。同时,整合不同平台的转录组数据(如 GSE51373、GSE63885、GSE15622、TCGA 卵巢癌数据),采用 “Rank-in” 方法消除批次效应。运用基因集富集分析(GSEA)探究差异基因富集的通路,并基于差异基因构建多种机器学习模型(包括随机森林、决策树、梯度提升决策树等 7 种模型),通过五折交叉验证优化参数,筛选出最优预测模型。
癌细胞鉴定与异质性分析
通过对 GSE165897 数据集的单细胞转录组分析,经质量控制和细胞类型注释,鉴定出上皮细胞、成纤维细胞、T 细胞等多种细胞类型。利用 inferCNV 基于 CNV 分析,将癌细胞与正常上皮细胞区分,发现癌细胞表现出独特的患者特异性表达模式,且与 T 细胞相比,基因组相对表达强度变化更大,最终确认所有上皮细胞均为癌细胞,凸显了肿瘤细胞异质性。
差异基因与通路分析
以铂无进展间隔期(PFI)≥6 个月为敏感组、<6 个月为耐药组,对癌细胞重新聚类,发现两组癌细胞表达模式明显不同。通过差异基因分析,筛选出多个与铂耐药相关的基因,如 APOA1、TFPI2 等,其中部分基因已被其他研究报道与卵巢癌铂耐药相关。GSEA 显示,耐药癌细胞中细胞增殖相关通路(如细胞对缺氧的反应、MAPK 信号、NF-κB 信号、细胞周期各阶段相关通路)、PI3K/Akt 信号通路及自噬通路显著上调,这些通路与卵巢癌的发展及铂耐药机制密切相关。
GPPS 模型构建与性能评估
研究整合 4 个数据集共 404 个样本(TCGA 卵巢癌 287 例,GEO 117 例),经 “Rank-in” 消除批次效应后,将数据分为训练集、测试集和独立验证集(GSE63885)。评估 7 种机器学习模型在不同特征基因数量下的性能,发现随机森林(RF)模型表现最佳。当特征基因数为 5 时(PAX2、TFPI2、APOA1、ADIRF、CRISP3),模型性能达到最优,测试集 AUC 为 0.993,独立验证集 AUC 为 0.989,该模型被命名为 GPPS(Genes to Predict Platinum response Signature)。进一步分析显示,耐药患者中 3 个基因(PAX2、CRISP3、ADIRF)上调,2 个基因(TFPI2、APOA1)下调,与单细胞测序结果一致。GPPS 模型在训练集、测试集和验证集中均能显著区分铂敏感与耐药患者,且预测准确性优于其他分子组合模型。
GPPS 模型的预后预测能力
通过 Kaplan-Meier 生存分析和多因素 Cox 回归模型,发现 GPPS 评分可作为独立预后因子。在 TCGA 队列和 GSE63885 验证队列中,GPPS 阳性组患者总体生存显著差于阴性组,提示 GPPS 模型不仅能预测铂响应,还可评估患者预后。
研究通过整合单细胞和批量转录组数据,结合机器学习,成功开发了卵巢癌铂响应预测模型 GPPS。该模型基于 5 个特征基因(PAX2、TFPI2、APOA1、ADIRF、CRISP3),在预测铂类化疗响应和患者预后方面展现出极高的准确性(AUC 达 0.989-0.993),优于现有生物标志物如 BRCA 突变等。研究揭示了自噬、PI3K/AKT 信号、细胞周期调控等通路在铂耐药中的关键作用,为深入理解卵巢癌铂耐药机制提供了新视角。
GPPS 模型的建立填补了临床可靠铂响应预测生物标志物的空白,有望为卵巢癌患者的个体化治疗提供重要依据,帮助医生制定更精准的治疗方案,避免不必要的治疗干预,提升患者生存率和生活质量。尽管研究基于公共数据集,存在一定局限性,但为后续更大规模的临床验证和应用奠定了坚实基础,未来若能整合 BRCA 突变等数据,可能进一步提升预测效能。该研究不仅为卵巢癌的精准治疗提供了新工具,也为其他癌症的治疗响应预测研究提供了方法学借鉴。