
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多组学分析揭示了复发I期非小细胞肺癌的生物学和临床见解
【字体: 大 中 小 】 时间:2025年02月11日 来源:Nature Communications 14.7
编辑推荐:
肺癌被认为是全球诊断最频繁的恶性肿瘤,也是癌症相关死亡的主要原因。大约 85% 的肺癌病例是非小细胞肺癌(NSCLC),而肺腺癌(LUAD)和肺鳞癌(LUSC)是 NSCLC 的两种主要亚型。在当前的临床实践中,手术是早期 NSCLC 的标准治疗方法。然而,尽管进行了手术切除,复发仍然是一个重大挑战。据估计,20% - 40% 的 I 期 NSCLC 患者会出现肿瘤复发。大约 80% 的复发发生在手术后 2 年内,并导致治疗失败。复发后的 5 年生存率很低,在 15% - 16.6% 之间。因此,迫切需要阐明 I 期 NSCLC 术后复发背后的生物学机制。
I 期非小细胞肺癌(NSCLC)术后复发率在 20% - 40% 之间。然而,复发背后的分子机制在很大程度上仍不明确。四川大学华西医院的研究人员对 122 例 I 期 NSCLC 患者的配对肿瘤和癌旁组织进行了基因组、表观基因组和转录组分析,其中 57 例患者在随访期间术后出现复发。综合分析表明,以实性或微乳头为主的组织学亚型、基因组不稳定性增加以及 APOBEC 相关特征与复发有关。此外,TP53 基因 DNA 结合域的错义突变可能导致复发时间缩短。复发性 NSCLC 中 DNA 低甲基化明显,PRAME 是复发性肺腺癌(LUAD)中显著低甲基化且高表达的基因。从机制上讲,TEAD1 结合位点的低甲基化促进了 PRAME 的转录激活。抑制 PRAME 通过下调上皮 - 间质转化相关基因来抑制肿瘤转移。研究人员还发现,拷贝数变异负担较高的 AT2 细胞、耗竭的 CD8 + T 细胞和 Macro_SPP1 的富集,以及 AT2 细胞与免疫细胞之间相互作用的减少,对复发性 LUAD 生态系统的形成至关重要。最后,多组学聚类可以将 NSCLC 患者分为 4 个亚组,各亚组具有不同的复发风险和亚组特异性的治疗靶点。总体而言,该研究为深入了解 I 期 NSCLC 术后复发的生物学机制和临床管理提供了有价值的资源。
肺癌被认为是全球诊断最频繁的恶性肿瘤,也是癌症相关死亡的主要原因。大约 85% 的肺癌病例是非小细胞肺癌(NSCLC),而肺腺癌(LUAD)和肺鳞癌(LUSC)是 NSCLC 的两种主要亚型。在当前的临床实践中,手术是早期 NSCLC 的标准治疗方法。然而,尽管进行了手术切除,复发仍然是一个重大挑战。据估计,20% - 40% 的 I 期 NSCLC 患者会出现肿瘤复发。大约 80% 的复发发生在手术后 2 年内,并导致治疗失败。复发后的 5 年生存率很低,在 15% - 16.6% 之间。因此,迫切需要阐明 I 期 NSCLC 术后复发背后的生物学机制。
为了了解促进肿瘤发生以及包括复发和转移在内的相关过程的事件,已有的研究表明,分子异常与肿瘤微环境内的相互作用之间存在复杂的关联。例如,由 TP53 突变和肿瘤内异质性等分子事件引起的基因组不稳定性,会导致肺癌的复发和转移。早期 NSCLC 中的 DNA 差异甲基化与随后的复发之间也存在重要关联。重要的是,肿瘤是复杂的生态系统,由多种细胞类型组成,这些细胞之间的相互作用对肿瘤的发展至关重要。在肺癌中,肺泡 II 型(AT2)细胞的富集和肺泡 I 型(AT1)细胞比例的降低代表着更高的恶性程度。此外,CD163 + 巨噬细胞的显著富集与更具侵袭性的癌症亚型和更差的预后相关,转移性肺癌的特征是免疫抑制状态,表现为 M2 型巨噬细胞增加。然而,缺乏对 I 期 NSCLC 术后复发的全面分子特征分析。此外,单平台分析无法捕捉肿瘤生态系统的复杂性,对表观基因组模式的研究也很有限。因此,多组学分析的整合成为揭示导致术后复发的综合分子特征的关键步骤,最终为个性化临床决策提供依据。
在这项研究中,四川大学华西医院的研究人员基于全外显子测序(WES)、纳米孔测序、RNA 测序(RNA - seq)和单细胞 RNA 测序(scRNA - seq)技术,对 122 例 I 期 NSCLC 患者的样本进行了基因组、转录组和表观基因组分析。研究人员的多组学研究探索了分子异常,并描绘了与手术切除后早期复发相关的肿瘤生态系统。该研究为未来对 I 期 NSCLC 复发的研究提供了有价值的资源,有助于研究生物学机制并揭示潜在的治疗策略。
为了全面阐明早期 NSCLC 术后复发的多组学特征,研究人员纳入了 122 例未经先前治疗的 I 期 NSCLC 患者的样本。从 47 例患者中收集了新鲜冷冻(FF)肿瘤和配对的癌旁正常组织。提取 DNA 和 RNA,并通过 WES、纳米孔测序和 RNA - seq 进行分析。对 61 例患者的福尔马林固定石蜡包埋(FFPE)肿瘤和匹配的正常癌旁组织进行 WES 分析。此外,从其余 14 例患者中获取的 14 个新鲜切除(FR)肿瘤和 11 个癌旁正常样本参与了 scRNA - seq 分析。根据至少 3 年的随访,患者被分为复发组(Rec,n = 57)和非复发组(NonRec,n = 65)。临床病理特征见补充表 1。
为了揭示与术后复发相关的基因组特征,研究人员对 108 例 NSCLC 患者进行了全面分析,包括 47 例 FF 组织患者和 61 例 FFPE 组织患者,揭示了 Rec 组和 NonRec 组之间的体细胞突变、基因特征、克隆结构和结构变异(SVs)谱。
与先前的研究一致,研究人员发现,已知的癌基因和抑癌基因中的体细胞突变,如 TP53(47%)、EGFR(30%)、APC(11%),在研究队列中普遍存在。研究人员还对 LUAD 样本进行了更精细的亚型分类,将其分为低级别(贴壁型)、中级别(腺泡型、乳头型)和高级别(微乳头型、实性为主型)组。高级别为主型组患者的复发率最高。TP53 突变在所有组中都是最常见的突变,但其在高级别为主型组中的发生率(75%)明显高于中 / 低级别为主型组(分别为 46% 和 29%)。此外,TP53 突变在 LUAD 的 Rec 组中更为频繁,这表明其可能具有更高的恶性程度。然后,研究人员进一步分析了与位点特异性差异和复发时间相关的突变。与胸内复发相比,发生胸外复发的患者中,包括 TP53 和 EGFR 在内的已知驱动基因的突变比例更高。TP53 基因 DNA 结合域的错义突变已被报道会影响 p53 的功能,因此研究人员还研究了其在复发时间中的作用,并发现它与无复发生存期(RFS)差显著相关。
根据突变谱,研究人员鉴定出 4 种突变特征(Sig1、Sig2、Sig3 和 Sig4)。Sig1 与 APOBEC 家族相关,而与 DNA 错配修复缺陷(dMMR)相关的 Sig2 由 C>T 转换定义,这两种特征在 Rec 组中均增加。此外,尽管 Rec 组和 NonRec 组之间的拷贝数变异(CNV)负担和肿瘤突变负荷(TMB)没有差异,但 LUAD 的 Rec 组中同源重组缺陷(HRD)评分显著更高。
为了揭示与 NSCLC 术后复发相关的克隆结构,研究人员使用 PyClone - VI 进行了系统发育分析。在所有患者中,大多数病例存在多个克隆。然后研究人员检查了系统发育模式是否与肺癌复发相关。生存分析表明,具有多个克隆的 LUAD 与显著更差的 RFS 相关。此外,在 LUAD 病例中,推断的系统发育表明,包括 EGFR、MET 和 ALK 在内的驱动突变发生在细胞占比高的克隆中,这些突变可被视为引发肿瘤发生的早期突变。在 LUAD 的 NonRec 组中,抑癌基因 TP53 突变很少发生在细胞占比最大的克隆中,而在 LUAD 的 Rec 组主要克隆中,其频率显著增加,这表明它可能是 LUAD 复发的一个促成因素。对于 LUSC,在 Rec 组和 NonRec 组的主要克隆中大多检测到抑癌基因。长读长测序可以更好地表征可能与 NSCLC 复发相关的 SVs,因此研究人员还检测了 Rec 组和 NonRec 组之间的 SVs。在体细胞 SV 谱中,重复是主要类型,研究队列中共有 891 个,其次是 687 个缺失。基于已报道的 NSCLC 相关基因,研究人员鉴定了选定的癌基因和抑癌基因的 SV 状态。在这些 SVs 中,在 LUSC 的 Rec 组中,患者 FF_33 的 PTEN 基因发生缺失,其表达与正常样本相比显著降低(FPKM:975.294 对 2648.635)。此外,LUAD 的 Rec 组中的另一个病例 FF_41 的 EGFR 基因出现显著重复,RNA - seq 显示其表达水平与配对的正常样本相比急剧增加(FPKM:7777.238 对 2102.873)。特别的是,这两个病例相应基因均无体细胞突变,这表明 SVs 有可能调节下游转录组改变并引发 NSCLC 术后复发。
总之,研究人员提供了一个全面的基因组图谱,并分析了与 NSCLC 复发相关的不同基因组因素。研究人员描述了以 TP53 突变为主的系统发育模式、更高的 HRD 评分、dMMR 和 APOBEC 胞苷脱氨酶特征为特点的基因组不稳定性增加,这些可能导致肺癌术后复发。
表观基因组的改变,如 DNA 甲基化,在包括肺癌在内的多种癌症的肿瘤发生、复发和转移中发挥了作用。在本研究中,研究人员利用纳米孔测序数据评估了 NSCLC 的 Rec 组和 NonRec 组之间的 DNA 甲基化谱。研究人员通过 Wald 检验(P <0.05 且差异> 0.1)鉴定出差异甲基化区域(DMRs)。LUAD 和 LUSC 在 Rec 组和 NonRec 组之间的差异甲基化图谱分别如图 2a 和图 2b 所示。总体而言,在 LUAD 中发现了 11412 个 DMRs,在 LUSC 中鉴定出 28671 个 DMRs。在 LUAD 和 LUSC 中,研究人员观察到 DMRs 在不同调控区域的分布趋势相似。这些变化大多发生在内含子区域,其次是远端基因间区域和启动子区域。
对 CpG 甲基化水平的分析表明,与 NonRec 组相比,LUAD 和 LUSC 的 Rec 组均表现出显著的低甲基化。为了鉴定 NSCLC 复发中表观遗传失调的通路,研究人员对 Rec 组中低甲基化基因进行了通路富集分析,结果表明 LUAD 中的上皮 - 间质转化(EMT)和 LUSC 中的炎症反应被激活。EMT 是一个众所周知的细胞程序,通过重塑细胞间和细胞 - 细胞外相互作用参与恶性进展。此外,KEGG 分析表明,Rap1 信号通路和细胞外基质 - 受体相互作用在 LUAD 和 LUSC 的 Rec 组中均富集。
DNA 甲基化可以调节基因表达,原发性肺癌病变中差异甲基化和基因表达的相互作用已被用于预测癌症进展。研究人员总共在 LUAD 和 LUSC 的 Rec 组中分别鉴定出 1642 个和 3613 个显著低甲基化基因。此外,研究人员检查了 Rec 组中低甲基化基因的表达水平。有趣的是,研究人员发现 LUAD 中有 6 个基因、LUSC 中有 8 个基因在 Rec 组中同时表现出低甲基化和上调。转录因子(TFs)的结合可能会被其 DNA 结合位点上的甲基化所减弱。因此,为了研究 TF 结合位点的甲基化如何影响靶基因的表达,研究人员鉴定了驱动低甲基化基因过表达的 TFs 集,以便进一步分析。随后,研究人员利用活性评分评估特定基因的表达与 TF 结合位点甲基化水平之间的关联。在这一过程中,研究人员观察到最强烈激活的基因是位于 22 号染色体上的 PRAME。在 PRAME 的相关 TFs 中,TEAD1 在调节组织稳态和肿瘤发生中起着关键作用。TEAD1 及其共激活因子 YAP/TAZ 的异常激活与多种癌症的进展有关。研究人员的结果还表明,TEAD1 结合位点的低甲基化与 PRAME 的过表达相关,并且 TEAD1 的表达与 PRAME 的表达呈正相关。
总之,与 NonRec 组相比,Rec 组中观察到显著的低甲基化,这可能会影响基因表达水平并导致术后复发。
研究人员利用差异表达分析来鉴定与 I 期 NSCLC 术后复发相关的转录组特征。在 LUAD 的 Rec 组和 NonRec 组之间共有 85 个差异表达基因(DEGs),在 LUSC 中则有 206 个(调整后 P <0.05 且 | log2FoldChange|> 1)。复发性 LUAD 中高表达的基因包括 PRAME、DRAIC 和 DUXAP8,而在 LUSC 的 Rec 组中,COL22A1、TIMD4 和 PLA2G2D 显著上调。然后,研究人员整合临床数据以评估 DEGs 的预后价值。LUAD 中的 DRAIC 和 DUXAP8,以及 LUSC 中的 TIMD4 和 COL22A1 被证明是与较差 RFS 相关的潜在 “高风险基因”。有趣的是,DRAIC 和 DUXAP8 分别被认为是促进乳腺癌和胰腺癌进展的癌基因。此外,高表达 TIMD4 的腔内巨噬细胞会损害 CD8 + T 细胞的抗肿瘤活性,从而促进癌症进展。
为了探索驱动肺癌复发的生物学过程,研究人员随后对 MSigDB Hallmarks 基因集进行了基因集富集分析(GSEA),并通过比较 Rec 组和 NonRec 组揭示了富集的通路。在 LUAD 和 LUSC 的 Rec 组中观察到 EMT 和血管生成等通路的激活,这些通路已知会触发癌细胞的迁移和扩散。此外,GO 和 KEGG 分析也表明,细胞外基质和细胞黏附分子相关通路在 Rec 组中上调。值得注意的是,细胞外基质重塑有助于上皮细胞从相邻细胞和基底膜脱离,这对 EMT 至关重要。细胞黏附分子如整合素可能导致肿瘤血管生成。因此,EMT 和血管生成是与 I 期 NSCLC 复发相关的常见生物学行为。
肿瘤免疫微环境(TIME)在肺癌进展中起着关键作用。为了表征与 NSCLC 复发相关的 TIME,研究人员使用定义的基因集计算了单样本基因集富集分析(ssGSEA)分数(幼稚型:TCF7、SELL、LEF1、CCR7;耗竭型:LAG3、TIGIT、PDCD1、HAVCR2、CTLA4;细胞毒性型:TNFSF10、CST7、GZMA、GZMB、NKG7、GNLY、IFNG、PRF1)。研究人员观察到,Rec 组中幼稚型和耗竭型特征明显更高,而细胞毒性评分在 Rec 组和 NonRec 组之间没有显著差异,这表明存在有利于复发的免疫抑制环境。
综上所述,研究人员的调查揭示了与 NSCLC 复发相关的关键 DEGs,并强调激活的 EMT 和血管生成特征可能导致 I 期 NSCLC 术后复发。此外,Rec 组的耗竭评分高于 NonRec 组,表明存在抑制性的 TIME。
如前所述,研究人员观察到 PRAME 在 LUAD 的 Rec 组中高表达且低甲基化。在功能上,PRAME 调节细胞死亡和维甲酸受体信号传导,这可能导致肿瘤进展和预后不良。
为了获得综合视角,研究人员创建了一个坐标轴,整合了 LUAD 的 Rec 组与 NonRec 组相比的转录组和表观基因组结果。考虑到差异表达和差异甲基化水平,PRAME 基因被确定为最显著的基因。在相关性分析中,LUAD 样本中 PRAME 的甲基化与表达之间存在明显的负相关。进一步,根据 PRAME 的表达水平,LUAD 样本被分为 PRAME 高表达组和 PRAME 低表达组。特征分析表明,与 PRAME 低表达组相比,PRAME 高表达组中多个增殖和转移相关通路,如 EMT、MYC 靶点 v1、E2F 靶点和 MTORC1 信号通路显著正富集。此外,生存分析表明,PRAME 的高表达与较差的 RFS 相关,P 值为 0.0065。
为了研究 PRAME 在 LUAD 复发中的作用,研究人员首先将 PRAME cDNA 扩增到 A549、PC9 和 H1299 细胞中(PRAME - OE 细胞)。伤口愈合实验表明,与对照细胞相比,PRAME - OE 细胞的细胞迁移率显著提高。转录组分析表明,PRAME 过表达上调了 EMT 基因特征、E2F 靶点基因特征以及多个参与细胞增殖和迁移的通路。RT - qPCR 结果证实,PRAME 过表达后,EMT 相关基因 ACTA2、COL1A1、DAB2、MMP2 和 TAGLN 的相对表达水平上调。与转录组分析一致,蛋白质免疫印迹显示,与对照细胞相比,PRAME - OE 细胞中增殖和迁移相关蛋白 mTOR、PCNA 和 Rap1 的表达上调。此外,研究人员将靶向 PRAME 基因的小干扰 RNA(siRNA)导入 A549、H1299 和 PC9 细胞中以抑制其表达。与 siNC 细胞相比,siPRAME 细胞的增殖和迁移明显受到抑制。蛋白质免疫印迹显示,PRAME 基因沉默显著抑制了 mTOR、PCNA 和 Rap1 蛋白的表达。
为了进一步验证 PRAME 在体内的作用,研究人员使用 CRISPR 设计工具设计了两种单向导 RNA(sgRNAs),并将 sgRNAs 与 Cas9 一起转导到 A549 细胞中。通过蛋白质免疫印迹证实了 PRAME 的敲除。PRAME 敲除显著抑制了细胞增殖和迁移。RT - qPCR 显示,与 sgScr 转染的细胞相比,sgPRAME 转染的 A549 细胞中 EMT 相关基因 ACTA2、COL1A1、MMP2 和 TAGLN 的相对表达水平显著降低。一致地,蛋白质免疫
生物通微信公众号
知名企业招聘