编辑推荐:
肺癌是全球癌症死亡的主要原因,肺腺癌(LUAD)作为其常见亚型,诊疗面临挑战。研究人员开展通过机器学习构建 LUAD 细胞衰老(CS)相关特征的研究。结果发现 8 个基因的 LUAD-CSRS,与患者生存、免疫及预后相关。该研究为 LUAD 诊疗和免疫治疗提供新方向。
肺癌,这一全球范围内的 “健康杀手”,长期霸占着癌症相关死亡原因的榜首,给人类健康带来了沉重的负担。肺腺癌(LUAD)作为非小细胞肺癌(NSCLC)中最常见的组织学亚型,约占 NSCLC 发病率的 40% 。由于其早期症状隐匿,缺乏有效的筛查手段,患者的五年生存率仅 15%。
细胞衰老(CS)作为一种不可逆的生长停滞状态,在肿瘤的发展过程中扮演着 “双刃剑” 的角色。在癌症发展的早期,它可能抑制肿瘤生长;而到了后期,却可能成为肿瘤复发和转移的诱因。在 LUAD 的发展、进展和免疫调节过程中,CS 涉及多种细胞和分子机制。已有研究表明,部分 LUAD 患者对 PD-1 抑制剂的临床反应较差,与循环中衰老 T 细胞的高丰度有关。因此,开发一种可靠的生物标志物,用于 LUAD 的诊断、预后评估和免疫治疗疗效预测,显得尤为迫切。
为了解决这些问题,天津中医药大学第一附属医院中心实验室等机构的研究人员开展了相关研究。他们利用多个公共数据库,通过加权基因共表达网络分析(WGCNA)等技术,构建了一种新型的 LUAD-CS 相关特征(LUAD-CSRS)。该研究成果发表在《Discover Oncology》上,为 LUAD 的精准诊疗提供了新的思路和方向。
研究人员开展此项研究时,主要运用了以下关键技术方法:首先,从 GEO 数据库和 TCGA 数据库下载 LUAD 患者转录组数据作为样本队列,进行数据处理,包括样本质量检查、数据标准化和批次校正等。接着,使用 WGCNA 分析构建无标度共表达网络,筛选与 LUAD 相关的基因模块。然后,通过 12 种机器学习算法组成的 113 组合机器学习框架,构建并验证 LUAD-CSRS 模型。此外,还运用 CIBERSORT 算法分析免疫细胞浸润情况。
下面来看具体的研究结果:
- LUAD-CSDEGs 的鉴定与富集分析:对四个数据集进行标准化和批次校正后,共鉴定出 3141 个差异表达基因(DEGs)。通过 WGCNA 分析,选取 β=9 构建无标度网络,得到 6 个共表达模块,其中蓝色模块与 LUAD 相关性最高。进一步筛选出 75 个 LUAD-CS 相关差异表达基因(LUAD-CSDEGs)。GO 富集分析显示,这些基因主要参与有丝分裂细胞周期转变、染色体分离等生物学过程;KEGG 通路富集分析表明,它们主要涉及 p53 信号通路、细胞周期、细胞衰老等通路。
- 通过 113 组合机器学习鉴定具有诊断价值的模型基因:运用 113 组合机器学习,在训练队列和验证队列中进行分析,最终由随机森林(RF)算法建立的模型表现最佳,AUC 值达到 0.988,并确定了 8 个关键基因(RECQL4、TIMP1、ANLN、SFN、MDK、KIF2C、AGR2、ITGB4)作为 LUAD-CSRS。混淆矩阵结果显示,该模型在训练和验证队列中均具有良好的诊断性能。
- LUAD-CSRS 的相关性和单基因 GSEA:与正常肺组织相比,LUAD-CSRS 基因在 LUAD 组织中表达上调。相关性分析表明,这些基因之间存在较强的相关性。单基因 GSEA 显示,它们参与组织稳态、免疫反应激活、细胞因子结合等生物学过程和通路。
- 免疫景观及免疫细胞与 LUAD-CSRS 的相关性:利用 CIBERSORT 算法估计 22 种浸润免疫细胞类型的比例,发现 LUAD 患者与正常肺组织相比,调节性 T 细胞(Tregs)和静息树突状细胞(DCs)等 10 种免疫细胞浸润增加,而幼稚 CD4 T 细胞和活化 DCs 等 8 种免疫细胞浸润减少。此外,除 AGR2 和 ITGB4 外,所有 LUAD-CSRS 基因与免疫细胞均有较强相关性,其中 RECQL4 与 Tregs 呈强正相关。
- LUAD-CSRS 在 LUAD 组织和细胞中的表达:通过对 TCGA 数据库中 LUAD 基因表达谱和 HPA 数据库中免疫组化(IHC)染色数据的分析,证实了 LUAD-CSRS 基因在转录和翻译水平均高表达。细胞免疫荧光(IF)定位显示,这些基因在细胞中的定位各有特点。
- LUAD-CSRS 与 ICI 治疗的潜在关系:分析 TCIA 数据集发现,LUAD 患者中,RECQL4、TIMP1、ANLN 和 KIF2C 等基因低表达的患者对 anti-CTLA-4 和 anti-PD-1 疗法的无反应性更好;部分基因低表达的患者对不同免疫治疗的反应存在差异,表明 LUAD-CSRS 基因与 PD-1 和 CTLA-4 密切相关,低表达患者可能更受益于免疫检查点抑制剂(ICIs)治疗。
- LUAD-CSRS 在 LUAD 中的预后价值:KM 生存曲线分析表明,除 MDK 外,LUAD-CSRS 基因高风险组患者的总生存期(OS)明显短于低风险组。单因素和多因素 Cox 回归分析确定了多个独立的风险因素,包括 T 分期、N 分期、ANLN 和 ITGB4 的中位数值等。构建的包含分期和 LUAD-CSRS 的列线图,能有效预测 LUAD 患者 1 年、3 年和 5 年的生存率,校准曲线显示其预测结果与实际结果吻合良好。
研究结论表明,该研究构建的 LUAD-CSRS 有望成为辅助 LUAD 诊断和预后评估的有力工具,还可能为个性化免疫治疗方案提供指导。不过,研究也存在一定局限性,如基于公共数据库的回顾性分析,缺乏完整的临床信息,且未进行体外或体内实验验证。
未来研究可进一步完善相关工作,例如建立中国北方肺癌数据库,开展大规模多中心临床研究;进行蛋白质组学分析,验证蛋白质表达模式;开展 10X scRNA-seq 分析,深入研究免疫逃逸机制等。总体而言,这项研究为 LUAD 的精准诊疗奠定了重要基础,具有重要的临床意义和潜在的应用价值。