《Hormones & Cancer》:Integrated transcriptomic and single-cell analysis reveals cell cycle dysregulation and cellular heterogeneity in lung cancer
编辑推荐:
本研究针对肺癌分子机制复杂及细胞异质性难题,通过整合bulk RNA-seq、WGCNA和scRNA-seq技术,系统解析了肺癌转录重编程特征与肿瘤微环境细胞组成。研究发现细胞周期关键调控因子(AURKA、FANCD2、HELLS、RRM2、STMN1)在肺癌细胞中显著上调(RT-qPCR验证达3.8-6.3倍),为肺癌靶向治疗提供了新靶点。
肺癌作为全球癌症相关死亡的主要原因之一,每年导致约180万人死亡,其五年生存率长期徘徊在15%-20%之间。这种严峻的预后状况主要归因于晚期诊断、高转移潜力、治疗耐药性以及肺癌发病机制中复杂的分子异质性。非小细胞肺癌(NSCLC)约占所有肺癌病例的85%,其中腺癌和鳞状细胞癌是最常见的组织学亚型。尽管高通量测序技术已经彻底改变了癌症研究,使肿瘤组织的转录景观得以全面表征,但传统的批量RNA测序方法分析的是数百万细胞的平均基因表达,从而掩盖了日益被认可为癌症标志的细胞异质性。
肿瘤不是同质的团块,而是由恶性细胞、免疫细胞、基质细胞和内皮细胞等不同细胞群组成的复杂生态系统,每种细胞都对肿瘤的发生、生长、转移和治疗反应做出贡献。这种细胞多样性对治疗疗效构成重大挑战,并且是治疗耐药性的主要驱动因素。单细胞RNA测序(scRNA-seq)技术的突破为剖析肿瘤微环境中的细胞异质性提供了前所未有的分辨率,能够识别不同的细胞群、稀有细胞类型和过渡细胞状态。此外,加权基因共表达网络分析(WGCNA)作为一种强大的系统生物学方法,能够识别共表达基因模块并将其与临床表型相关联,从而识别可能作为关键调控因子或治疗靶点的枢纽基因。
在这项发表于《Discover Oncology》的研究中,研究人员采用整合多组学方法,结合批量RNA测序、WGCNA、功能富集分析和单细胞RNA测序,全面表征了肺癌的转录景观和细胞异质性。研究发现揭示了广泛的转录重编程,识别了与临床特征相关的功能相关模块,描绘了疾病发病机制中富集的生物学通路,并通过单细胞分析揭示了不同的细胞群及其沿伪时间轨迹的动态转变。
研究人员为开展本研究采用了几个关键技术方法:通过批量RNA测序对肺癌组织和癌旁正常样本进行转录组分析以识别差异表达基因;利用WGCNA构建基因共表达网络并识别与临床表型相关的功能模块;采用功能富集和通路分析阐明生物学意义;基于GEO数据库获取的单细胞RNA测序数据(GSM5024082)进行细胞异质性表征和伪时间轨迹重建;使用RT-qPCR和ELISA分别在A549和H1299肺癌细胞系中验证关键基因的mRNA和蛋白表达水平。
转录组分析揭示肺癌中广泛的基因失调
通过批量RNA测序分析发现肺癌中存在广泛的转录重编程,上调和下调基因呈对称分布。热图显示差异表达基因在不同患者样本间具有明显的表达模式,聚类分析显示样本组间清晰分离。火山图显示大量基因具有较高的倍数变化和较强的统计学显著性,表明肺癌中发生了深刻的分子改变。
加权基因共表达网络分析识别关键分子模块
WGCNA分析通过尺度拓扑分析确定最佳软阈值功率(β=6),构建了符合生物学系统幂律分布的基因共表达网络。模块特征基因的层次聚类揭示了某些模块之间更密切的功能关系。模块-性状关系热图显示青绿色和蓝色模块与临床表型具有特别显著的相关性,这些模块中的基因可能作为生物标志物或治疗靶点。
功能富集分析揭示肺癌关键生物学通路
基因本体(GO)富集分析显示生物学过程如骨化、白细胞趋化、药物代谢过程、皮肤发育和G蛋白偶联受体信号通路显著富集。细胞组分分析显示顶质膜、细胞外区域、中间纤维细胞骨架、基底外侧质膜、紧密连接和基底膜成分显著富集,表明细胞结构重塑和上皮极性破坏。分子功能分析显示氧化还原酶活性、受体结合、转移酶活性等显著富集。通路分析发现金黄色葡萄球菌感染反应、Wnt信号、细胞因子-细胞因子受体相互作用、雌激素信号、ECM-受体相互作用、药物代谢、Hedgehog信号、紧密连接、化学致癌作用和脂质代谢等通路显著富集。
单细胞RNA测序揭示肺癌细胞异质性
单细胞RNA测序数据分析通过PCA肘部图确定聚类的最佳维度,质量控制显示肿瘤和正常样本间RNA含量分布不同。t-SNE和UMAP可视化均显示肿瘤微环境中存在多个不同的细胞群,包括上皮细胞、免疫细胞(B细胞、NK细胞、树突状细胞)、成纤维细胞和增殖细胞。高度可变基因的火山图识别了驱动细胞异质性的基因,特别是免疫球蛋白基因。
细胞类型鉴定和轨迹分析
通过典型标记基因表达模式进行细胞类型鉴定,确认了上皮细胞(EPCAM、KRT19、CDH1)、B细胞(CD79A、MS4A1、CD19)、NK细胞(NKG7、GNLY、KLRD1)、树突状细胞(CD1C、CLEC9A、FCER1A)、成纤维细胞(COL1A1、DCN、LUM)和增殖细胞(MKI67、TOP2A、PCNA)等细胞群。伪时间轨迹分析重建了细胞状态转变,揭示了分支点处细胞命运的分离以及分化通路沿线的过渡状态。谱系树图以饼图形式展示了轨迹节点处的细胞组成,提供了对肺癌生态系统中免疫细胞活化、上皮细胞转变和基质细胞分化等动态细胞过程的见解。
伪时间动力学和关键基因表达
密度图显示不同细胞类型沿伪时间轨迹的分布,增殖细胞在早期和晚期伪时间阶段均显示显著峰值,表明增殖活动贯穿肿瘤进化全过程。五个关键增殖和细胞周期相关基因(AURKA、FANCD2、HELLS、RRM2、STMN1)在不同细胞状态中显示不同的表达模式,AURKA和STMN1在特定状态(尤其是状态13)中表达集中,表明细胞周期调控的协调性,而FANCD2和HELLS在多个状态中表达分布更广。
RT-qPCR验证细胞周期调控因子的差异表达
RT-qPCR验证显示所有五个基因在肺癌细胞系中均显著上调。A549细胞中AURKA(4.2倍,p<0.001)、FANCD2(3.8倍,p<0.001)、HELLS(5.1倍,p<0.001)、RRM2(6.3倍,p<0.001)和STMN1(4.7倍,p<0.001)表达升高。H1299细胞显示类似表达模式:AURKA(3.9倍,p<0.001)、FANCD2(4.1倍,p<0.001)、HELLS(4.8倍,p<0.001)、RRM2(5.9倍,p<0.001)和STMN1(5.2倍,p<0.001)。ELISA分析进一步在蛋白水平验证了这些基因的上调:A549细胞中AURKA(3.1倍)、FANCD2(2.8倍)、HELLS(3.5倍)、RRM2(4.2倍)和STMN1(3.3倍),所有p<0.01。
研究结论与讨论部分强调,这项综合研究通过整合多组学方法剖析了肺癌的转录景观和细胞异质性,揭示了广泛的转录重编程、功能相关基因模块、多样细胞群以及五个协调表达的细胞周期调控因子。与之前主要关注基质异质性和癌症相关成纤维细胞群的单细胞研究相比,本研究对增殖细胞群及其沿伪时间轨迹的转录动力学提供了更深入的表征。功能富集分析揭示了细胞增殖、免疫反应和代谢重编程的失调,以及Wnt、Hedgehog和雌激素信号等发育信号通路的激活,反映了癌症细胞侵袭和转移的标志性改变。单细胞RNA测序显示的显著细胞异质性对理解治疗反应具有深远意义,因为不同细胞群表现出不同的药物敏感性。伪时间轨迹分析表明增殖细胞在肿瘤进化的关键发育窗口期均有活跃增殖。五个细胞周期调控因子的协调表达模式揭示了增殖程序的整合调控:AURKA促进染色体不稳定性,FANCD2通过DNA损伤修复维持基因组稳定性,HELLS调控染色质重塑和表观遗传模式,RRM2是DNA复制所必需的,STMN1调控微管动力学并与不良预后相关。这些基因的协调过表达表明它们在一个促进不受控增殖的整合网络中发挥作用。靶向多个节点的组合疗法可能比单药方法更有效,例如将细胞周期抑制剂与化疗、DNA损伤反应抑制剂或免疫疗法相结合。该研究的优势包括整合批量与单细胞测序、通过WGCNA进行系统水平分析以及RT-qPCR验证,但局限性包括需要功能验证的描述性性质、样本量适中、单时间点分析以及关注转录水平而非蛋白水平。未来研究应包括通过基因操作进行功能验证、在更大队列中进行临床验证、调控网络的机制研究、靶向抑制剂的临床前评估、空间转录组学和多组学整合。临床意义重大,这五个细胞周期调控因子为患者分层提供了潜在的生物标志物和治疗靶点,揭示的细胞异质性对理解治疗耐药性和设计同时靶向多个细胞群的组合策略具有启示意义。