《Cancer Science》:Decoding Senescence-Driven Heterogeneity in Early-Onset Colorectal Cancer for Prognostic and Therapeutic Stratification
ABSTRACT
早发性结直肠癌(EOCRC)指发病年龄在50岁以下的结直肠癌,其侵袭性强且缺乏针对性治疗策略。本研究旨在探讨细胞衰老在驱动EOCRC恶性进展中的作用,并开发了一种衰老评分系统(EO-Senscore)以指导精准肿瘤学。通过对2961名患者进行多组学分析,发现细胞衰老在EOCRC中更为显著和异质,且与 chronological age 无关。研究鉴定出两种不同的衰老亚型:Cluster 1(低衰老肿瘤)表现出更长的生存期、增强的免疫原性和细胞周期激活,而Cluster 2(高衰老肿瘤)则表现出侵袭性表型和免疫抑制微环境。进一步开发了机器学习模型EO-Senscore来量化肿瘤的衰老水平。该评分能有效按预后和潜在治疗反应对患者进行分层。低EO-Senscore患者预计对免疫治疗和化疗反应良好。相比之下,高分患者肿瘤更具侵袭性,但在实验室实验中显示出对衰老清除药物(如ABT-263)的显著敏感性。总之,本研究确立了细胞衰老是EOCRC侵袭性的关键因素。EO-Senscore提供了一个实用的定量工具来指导临床决策,表明患者可被导向免疫治疗或新型基于衰老清除的联合疗法,以实现更个性化和有效的癌症治疗。
1 Introduction
结直肠癌(CRC)仍是全球癌症相关发病率和死亡率的主要原因,构成重大全球健康负担。虽然CRC历来与老年人群相关,但过去二十年间出现了一个显著的流行病学转变:早发性结直肠癌(EOCRC,诊断于50岁以下个体)的全球发病率每年增长约2%–4%,而与老年人群发病率下降形成对比。这一人口结构转变呈现出一个紧迫的临床悖论。尽管EOCRC与晚发性结直肠癌(LOCRC)的总生存期结果相当,但EOCRC肿瘤表现出独特的生物学侵袭性,包括更高频率的晚期诊断和淋巴结转移(LNM)。临床上,缺乏针对年龄的特异性治疗指南常导致过度治疗而无生存获益,且关键缺乏生物标志物来指导精准策略。
细胞衰老——一种持久的细胞周期停滞,伴随代谢重编程和促炎因子分泌——在癌症中扮演双重角色。最初作为通过停止增殖来抑制肿瘤的屏障,衰老细胞可通过SASP介导的肿瘤微环境(TME)重塑, paradoxically 促进免疫逃逸、血管生成和转移。在CRC中,衰老的功能意义仍取决于背景且定义不清,尤其在EOCRC中。有趣的是,初步数据表明,与LOCRC相比,EOCRC表现出更显著的衰老特征,其中衰老与 chronological aging 脱钩,并作为一种内在的肿瘤细胞状态驱动更高的恶性程度。这挑战了将衰老视为被动年龄相关屏障的观点,将其定位为动态治疗靶点。此外,EOCRC显著更高的临床侵袭性(晚期、转移)凸显了这种衰老状态的突出作用。然而,EOCRC缺乏有效的年龄特异性指南和精准生物标志物,使得这些衰老途径的分子异质性和转化潜力未被探索。
为应对这些关键知识空白,我们采用综合方法,整合单细胞测序(scRNA-seq)和 bulk RNA 测序(RNA-seq)数据分析细胞衰老对EOCRC的影响。通过此多组学分析,我们鉴定了EOCRC的两种 distinct 衰老亚型,其特征是显著不同的生物学特征和预后。此外,我们基于EOCRC患者数据构建了衰老评分系统,并评估其作为预后生物标志物以指导临床治疗决策的效用。总之,本研究显著促进了我们对衰老在EOCRC中作用的理解,为EOCRC患者精准医学策略的发展提供了新见解。
2 Material and Methods
2.1 Data Acquisition and Processing
本研究的工作流程如图1所示。共筛选了七个合格的 bulk RNA-seq 队列和一个单细胞RNA-seq(scRNA-seq)队列(GSE236581),所有队列均包含匹配的临床注释和高质量基因表达谱。七个 bulk RNA-seq 队列包含2961名患者,其中473名为EOCRC,2488名为LOCRC。
我们的内部ICGC-ARGO队列(由中山大学附属第六医院生成)包含975个CRC组织样本的RNA-seq数据,其中234例为EOCRC病例;该队列用作训练集。来自癌症基因组图谱(TCGA)的CRC患者TPM(Transcripts Per Million)数据从TCGA门户下载,选择74例EOCRC病例作为外部验证队列。
此外,从基因表达综合数据库(GEO)检索了五个公开可用的CRC队列(GSE39582, GSE17538, GSE39084, GSE14333, GSE75315)。三个包含EOCRC生存信息的GEO数据集(GSE39582, GSE17538, GSE39084)被合并形成Meta-GEO验证队列。为校正批次效应并确保跨平台数据的可比性,应用了“sva” R包中实现的ComBat算法。
从文献中获得了预定义的衰老相关基因集(SenMayo),包含125个基因。为评估衰老基因表达的异质性,我们计算了EOCRC和LOCRC队列之间SenMayo基因谱的欧几里得距离。欧几里得距离是用于量化高维数据差异的标准指标,测量样本在多维基因表达空间中的直线距离。较大的平均欧几里得距离表明基因表达的分散度和异质性更大。
2.2 Histological and Immunohistochemical Staining
福尔马林固定石蜡包埋(FFPE)肿瘤组织块被切片(4μm)。苏木精和伊红(H&E)染色确认肿瘤区域。对于免疫组织化学(IHC)分析,切片被干燥并使用自动化系统(BenchMark XT, Roche)进行Ki67检测。Ki67阳性信号显示为棕色核染色。全玻片图像(WSIs)在20倍放大下使用Aperio扫描仪获取。
2.3 Identification of the Core Senescence-Associated Genes
基于GEO、TCGA和ICGC-ARGO队列的转录组数据,在EOCRC患者中进行单变量Cox回归,以识别与无病生存期(DFS)显著相关的基因。p < 0.01的基因被认为是预后相关的。这些基因与SenMayo基因集的交集产生了EOCRC的13基因核心衰老相关基因(CSG)特征。
2.4 Establishment of Senescence Subtypes
使用“NMF”包进行非负矩阵分解(NMF),以基于13个CSGs的表达谱识别EOCRC患者中的 distinct 衰老亚型。
2.5 Assessment of Biological Characteristics Between Clusters
为量化特定生物途径的活性,我们使用“GSVA” R包进行了单样本基因集富集分析(ssGSEA)。基因标识符被转换为Entrez ID以匹配Broad研究所的HALLMARK基因集。从分子特征数据库(MSigDB)使用关键词如“SENESCENCE”、“AGING”、“SENESCENT”检索衰老相关基因集,并使用术语如“METASTASIS”、“EMT”、“INVASION”收集转移相关基因集。此外,我们评估了10条致癌途径的活性。
使用已发表的衰老相关评分,包括Lv等人的特征评分、Core SASP评分和Basisty等人的分泌性衰老相关分泌表型(sSASP)评分,来评估EO-Senscore亚型之间的衰老差异。从京都基因与基因组百科全书(KEGG)数据库获得凋亡基因集。使用“maftools” R包分析基因组变异。为探索肿瘤-免疫相互作用并预测免疫治疗反应,使用“IOBR” R包分析免疫相关基因和特征。
2.6 Construction of EO-Senscore
为量化EOCRC中的细胞衰老,我们应用LASSO算法,使用“glmnet” R包进行特征选择和模型构建。从预定义的衰老相关基因集中,通过单变量Cox回归识别出28个DFS相关基因(p < 0.05)。使用十倍交叉验证选择最优惩罚参数(lambda),得到17个核心基因。然后使用LASSO衍生的系数,将每个患者的EO-Senscore计算为基因表达水平的加权和。
根据“survminer” R包确定的最佳截断值将患者分为高分组和低分组,该分类用于下游分析。
2.7 scRNA-Seq Data Processing and Analysis
从接受新辅助抗PD-1治疗的八名EOCRC患者的GEO数据集GSE236581中检索scRNA-seq数据,并使用Seurat包(v5)进行处理。根据Chen等人进行质量控制(QC),过滤掉具有以下条件的细胞:UMI计数<600或>25,000,检测到的基因<600,或线粒体基因百分比>5%(或CD45-细胞中>70%)。仅保留通过QC的细胞。使用NormalizeData标准化数据,并使用FindVariableFeatures识别前2000个高变基因。这些基因使用ScaleData进行缩放以减少噪音。进行主成分分析(PCA)以进行降维。
基于EO-Senscore pseudo-bulk 值将患者分为高分组和低分组,并比较肿瘤上皮组织中的细胞类型组成和衰老相关标志物表达。
2.8 Immunotherapy Response Analysis
从Qin等人获得了免疫检查点相关基因。评估了已建立的免疫治疗反应预测因子,包括肿瘤突变负荷(TMB)、肿瘤免疫功能障碍和排斥(TIDE)评分和MIRACLE评分。
此外,使用了三个免疫治疗队列作为补充数据集:IMvigor210,包含用抗PD-L1药物治疗的转移性尿路上皮癌样本,源自“IMvigor210CoreBiologies”包;GSE91061,包含用抗PD-1免疫检查点阻断(ICB)治疗的晚期黑色素瘤样本,从GEO数据库下载;PRJEB23709,一个用抗PD-1和抗CTLA-4联合疗法治疗的转移性黑色素瘤样本队列,从欧洲分子生物学实验室(EMBL)访问。
2.9 Cell Lines and Culture Conditions
从癌症细胞系百科全书(CCLE)获得了79个结直肠腺癌细胞系的转录组数据。人CRC细胞系(SW480, HCT116, LoVo, HCT15)购自ATCC,并在含10% FBS和1%青霉素-链霉素的RPMI-1640或DMEM培养基中,在37°C、5% CO2的加湿培养箱中培养。
我们研究了来自不同组的细胞系对化疗药物的敏感性,如癌症药物敏感性基因组学(GDSC)数据库所预测。
2.10 Cell Counting Kit-8 (CCK8) Assays and Apoptosis Analysis
将细胞(5000/孔)铺在不透明壁的96孔板中,并在100μL培养基中过夜孵育。24小时后,加入ABT-263(Selleck, USA)并孵育72小时。然后加入10μL CCK8溶液(Abbkine, China),2小时后,使用Varioskan Flash读数器(Thermo Scientific, USA)测量450nm处的吸光度。使用GraphPad Prism 7.05中的非线性回归生成药物剂量反应曲线。使用Annexin V-APC/7-AAD凋亡试剂盒(MultiSciences, China)评估凋亡。将细胞(每孔3×105个)用5μM ABT-263(或DMSO)处理48小时。收集贴壁和悬浮细胞,用冷PBS洗涤,并用Annexin V-APC和7-AAD染色。在CytoFLEX S流式细胞仪(Beckman, USA)上进行流式细胞术,并使用FlowJo V10软件分析数据。使用GraphPad进行绘图和统计分析。使用Student's t检验比较两组间的差异。p值<0.05被认为具有统计学显著性。
2.11 Statistical Analysis
所有数据处理和统计分析均使用R软件(版本4.1.3)进行。使用Wilcoxon秩和检验评估两组间的差异,而使用Kruskal-Wallis检验比较多组间的变异。使用“survminer” R包进行Kaplan-Meier生存曲线和对数秩检验。使用Spearman等级相关系数进行相关性分析。所有体外实验至少重复三次,数据表示为平均值±SEM。通过双尾Student's t检验确定统计学显著性。统计学显著性定义为p值<0.05。
3 Results
3.1 Clinicopathological and Senescence Distinctions Between EOCRC and LOCRC
我们分析了七个RNA-seq数据集经过批次校正整合后共2961名CRC患者的转录组谱。随后的临床病理学分析揭示了EOCRC和LOCRC之间的显著差异。与LOCRC相比,EOCRC患者呈现更晚的TNM分期(59.7% vs. 51.4%, p=0.001)、更高的LNM发生率(52.6% vs. 42.8%, p=0.001)、更高比例的低分化肿瘤(7.2% vs. 6.2%, p=0.001)和更高的微卫星不稳定性高(MSI-H)状态频率(20.1% vs. 15.5%, p=0.021)。此外,EOCRC肿瘤更常位于左半结肠(64.3% vs. 57.9%, p=0.021),而组间性别分布无显著差异。然而,EOCRC和LOCRC患者的总生存期(OS)和DFS无显著差异。
为进一步探索EOCRC和LOCRC之间的分子差异,我们对HALLMARK途径进行了ssGSEA。分析显示,与肿瘤转移相关的途径,如EMT、TGF-β和NOTCH信号,在EOCRC患者中更富集。基因集富集分析(GSEA)进一步证实,与LOCRC相比,EOCRC肿瘤表现出包括EMT(ES=2.13, p<0.001)、MAPK信号(ES=1.26, p=0.01)、NOTCH信号(ES=1.55, p=0.01)和WNT信号(ES=1.28, p=0.02)在内的途径的显著富集。此外,其他转移和侵袭相关途径在EOCRC中比在LOCRC中显著更富集,支持EOCRC肿瘤具有更具侵袭性和转移性的表型的观点。支持这些转录组发现,ICGC-ARGO队列(n=524)的免疫组织化学分析显示EOCRC肿瘤中Ki67表达显著更高。EOCRC显示出更分散的Ki-67分布(IQR=20.00 vs. LOCRC的11.25)和更高的上四分位数(Q3=50 vs. 40)。这表明EOCRC肿瘤具有更高比例的高增殖性肿瘤。此外,使用40%的阈值,EOCRC表现出更高比例的Ki-67高肿瘤(28.0% vs. LOCRC的19.9%),强化了EOCRC中更强增殖活性的趋势。
有趣的是,我们发现细胞衰老评分与患者的实际年龄并未显示正相关,而是呈现负相关趋势(R=-0.05, p=0.003)。这种最小的关联表明,在EOCRC中观察到的 elevated 衰老表型在很大程度上独立于患者的 chronological age。值得注意的是,EOCRC患者表现出显著更高的衰老评分和与细胞衰老机制相关的关键生物标志物的 elevated 表达。衰老和 aging 相关途径在EOCRC组织中也更富集,突出了显著的衰老表型。此外