编辑推荐:
为解决肺腺癌诊疗难题,浙江中医药大学第三附属医院的研究人员开展糖基化修饰在肺腺癌转移中作用的研究。他们发现关键基因,构建有效预后模型。该研究为肺腺癌治疗提供新靶点和思路,强烈推荐科研读者阅读。
浙江中医药大学第三附属医院(Department of General Surgery, The Third Affiliated Hospital of Zhejiang Chinese Medical University)的研究人员 Pengcheng Zhang、Lexin Wang 等人在《BMC Cancer》期刊上发表了题为 “Unveiling the crucial role of glycosylation modification in lung adenocarcinoma metastasis through artificial neural network-based spatial multi-omics single-cell analysis and Mendelian randomization” 的论文。这篇论文在肺癌研究领域意义重大,为深入理解肺腺癌(Lung adenocarcinoma,LUAD)的发病机制、寻找潜在治疗靶点以及制定精准治疗策略提供了关键线索,有望推动肺腺癌诊疗技术的进步,改善患者的预后。
研究背景
肺癌是全球范围内严重威胁人类健康的恶性肿瘤,在癌症相关死亡原因中居首位,其中非小细胞肺癌(Non-small cell lung cancer,NSCLC)占比约 85%,而肺腺癌又是 NSCLC 中最主要的组织学亚型 。肺腺癌起源于支气管黏膜上皮,其发展隐匿,早期转移难以察觉,多数患者确诊时已处于晚期,给诊断和治疗带来极大挑战。虽然分子生物学和靶向治疗的发展为肺癌治疗带来了新希望,但在精准诊断和有效治疗方面仍存在不足,因此寻找新的生物标志物对改善患者预后、指导治疗意义重大。
糖基化(Glycosylation)是一种常见的蛋白质翻译后修饰,它在维持分子稳定性、改变理化性质和影响生物学功能等方面发挥着关键作用。糖基化过程异常与多种癌症的发生、发展密切相关,在癌细胞的黏附、细胞外基质相互作用、信号通路传导以及免疫逃逸等过程中扮演重要角色。已有研究表明,糖基转移酶基因(Glycosyltransferase genes,GTs)可作为多种肿瘤的潜在生物标志物,但针对肺腺癌中 GTs 相关生物标志物的研究较少,其在肺腺癌中的作用机制也有待深入探索。本研究旨在利用多组学技术深入探究糖基化在肺腺癌中的作用,寻找潜在治疗靶点,为肺腺癌的诊疗提供新方向。
研究方法
- 数据来源与处理:从 GEO 平台获取单细胞转录组数据(GSE123902),经一系列严格筛选和处理,包括去除低质量数据、过滤双峰细胞和 RNA 污染物等,最终得到高质量细胞数据。同时,从 UCSC 数据库获取包含肺腺癌生存数据的转录组数据集,并从 GEO 获取相关验证数据集(GSE50081)。对空间转录组数据(GSE179572)分别在 R 和 Python 环境中进行处理,以分析基因表达模式和细胞间相互作用。
- 糖基化预后基因筛选:研究人员先确定了 186 个与糖基化相关的基因,通过与肺腺癌差异表达基因进行重叠分析,再利用单变量 Cox 回归和 bootstrap 内部验证,筛选出 29 个具有预后意义的基因,后续利用 STRING 数据库进行蛋白质 - 蛋白质相互作用(PPI)分析,探究这些基因的生物学功能。
- 单细胞基因集评分与功能分析:运用 AUCell、UCell 等五种不同的评分方法对单细胞数据集进行综合评估,计算综合得分后将样本分为高、低表达两组进行后续分析。利用 SCENIC 分析确定肿瘤细胞亚群的转录调控网络,借助 Gene Ontology(GO)和 KEGG 数据库对差异表达基因进行功能富集分析,并采用文献中的分析技术量化恶性细胞亚群的代谢途径活性差异。
- 构建预后模型与评估:基于深度学习的 DeepSurv 神经网络结合 Cox 比例风险模型,构建糖基化预后模型(Glycosylation Prognostic Score,GT score)。利用 Shapley Additive exPlanations(SHAP)算法解析模型中各基因的贡献,通过 survminer 包确定最佳截断值,将患者分为高、低 GT score 组。此外,还利用多种方法评估模型的预测准确性,并构建列线图(Nomogram)提高临床实用性。
- 免疫微环境与免疫治疗预测:借助 ESTIMATE 算法评估肿瘤微环境中基质细胞和免疫细胞的浸润情况,使用 CIBERSORT、EPIC 等六种分析工具深入探究高低 GT score 组间免疫细胞浸润差异。参考 IMvigor210 研究,利用 submap 和 TIP 算法预测模型对免疫治疗的反应和 T 细胞功能变化。
- 突变分析与药物筛选:从 TCGA 数据库获取多种突变数据和转录组数据,计算肿瘤突变负荷(Tumor mutation burden,TMB)等指标,利用 GISTIC2.0 和 maftools 可视化染色体突变位点和基因突变信息。通过 GSEA 分析确定高 GT score 组激活的致癌通路,结合 CTRP v.2.0 和 PRISM Repurposing 数据集筛选潜在治疗药物。
- 孟德尔随机化筛选关键致病基因:从 IEU 数据库提取与基因相关的表达数量性状位点(Expression quantitative trait locis,eQTLs),经过严格筛选后,以 eQTLs 为暴露变量,肺腺癌为结果变量,利用 TwoSampleMR R 包进行孟德尔随机化分析,确定与肺腺癌有因果关系的关键基因,并进行外部验证。
- 细胞实验验证:培养支气管上皮细胞(BEAS - 2B)和肺腺癌细胞系(Calu - 3 和 PC - 9),利用 Lipofectamine 2000 转染小干扰 RNA(siRNA)抑制目标基因表达。通过 Western blot、qRT - PCR 检测基因表达水平变化,运用 CCK - 8、EdU 检测细胞增殖能力,Transwell 实验评估细胞迁移和侵袭能力,同时测定细胞内糖原含量和晚期糖基化终末产物(Advanced glycation end products,AGEs)浓度。
研究结果
- 关键糖基化修饰基因在恶性上皮细胞中显著富集:研究人员对 TCGA - LUAD 数据集进行分析,通过单变量 Cox 回归确定了 29 个糖基化相关的预后基因(GT - DEGs),其中 17 个为风险因素,12 个为保护因素。这些基因在癌组织中显著上调,且高表达 GT - DEGs 的患者预后较差。单细胞数据分析表明,恶性细胞的 GT score 显著高于其他细胞类型,且转移组织中的 GT score 高于原发性肿瘤组织,提示转移组织可能经历更显著的糖基化修饰。
- 高糖基化亚组在转移组织中显著富集:对恶性细胞进行降维和聚类分析发现,0、2 和 6 号簇的 GT score 表达显著高于其他组,且这三个簇在转移组织中特异性存在。Cytotrace 分析显示,这三个簇的干性明显低于其他簇。进一步分析发现,高 GTs 恶性细胞在转移组织中占主导地位,且在分化轨迹上处于终端位置,随着分化程度的增加,GT score 逐渐升高,表明糖基化修饰可能参与恶性细胞的转移和分化过程。
- GTs 恶性亚组的功能差异与细胞通讯:代谢分析表明,高 GTs 恶性细胞的代谢活性更高,可能促进肿瘤细胞转移。SCENIC 分析揭示了高 GTs 恶性组和其他 GTs 恶性组之间的转录差异,高 GTs 恶性组中 STAT 家族转录因子以及 JUN、FOS 等炎症反应关键因子显著高表达,而其他 GTs 恶性组主要表达与细胞生长和血管生成相关的转录因子。细胞通讯分析发现,高 GTs 恶性组主要利用 WNT 和 TGF - β 信号通路与其他细胞相互作用,而其他 GTs 恶性组更倾向于利用 EGF 和 SAA 信号通路。
- GTs 恶性亚组的空间分布与细胞通讯:空间转录组分析显示,高 GTs 恶性细胞主要分布在肿瘤巢和血管内皮附近,而其他 GTs 恶性细胞分布更广泛。伪时间轨迹分析表明,其他 GTs 恶性亚组倾向于从周边向高 GTs 恶性亚组所在的血管内皮附近分化。空间细胞通讯分析进一步证实,高 GTs 恶性亚组周围存在特定的配体 - 受体对,如 WNT5A - FZD5、TGFB1 - TGFBR2 等。
- 神经网络预后模型的构建:基于 GT - DEGs 构建的神经网络预后模型经过三轮迭代得到 GT score,将患者分为高、低表达组。在 TCGA - LUAD 数据集和另一验证数据集中,高 GTs 组患者的预后明显较差。该模型的预测准确性极高,1、3 和 5 年的 AUC 曲线分别达到 0.84、0.83 和 0.89,校准曲线和决策曲线分析也证实了其精确性和临床实用性。
- 预后模型的免疫微环境特征:ESTIMATE 分析显示,高 GTs 组的免疫评分、基质评分和估计评分较低,肿瘤细胞纯度较高,免疫细胞浸润较少,处于免疫抑制状态。六种免疫浸润算法评估结果表明,高 GTs 组中 CD4 T 细胞、CD8 T 细胞等免疫细胞亚群显著减少。此外,高 GTs 组中氧化应激和 WNT 信号通路显著富集,两组在癌症相关染色质重塑的潜在调节因子表达上存在明显差异。
- 免疫治疗预测:利用 IMvigor210 队列评估模型对免疫治疗反应的预测能力,结果表明模型在多种癌症类型中均有效。在 IMvigor210 队列中,高 GTs 组患者预后更差,对 atezolizumab 的反应较差,部分患者更可能从 PD - 1 阻断治疗中获益。TIP 算法分析显示,高 GTs 组在免疫反应的启动、免疫细胞向肿瘤的迁移和浸润等环节具有较高活性,但在癌细胞抗原释放、T 细胞识别癌细胞和癌细胞清除等方面存在缺陷。
- 突变景观分析:对高低 GTs 组进行基因组突变景观分析,计算 TMB、筛选差异突变基因和显著拷贝数改变基因等,结果显示两组在多个方面存在不同程度的突变差异,GISTIC 分析和瀑布图进一步展示了两组在染色体突变位点和突变基因上的显著差异。
- GSEA 分析与药物预测:GSEA 分析发现,高 GTs 组中缺氧、氧化应激、TGF - β、PI3K - AKT 和 WNT 等通路显著激活。通过对 CTRP 和 PRISM 数据集的分析,筛选出 lapatinib 和 ispinesib 等药物可能对高 GTs 组患者有效,同时以顺铂为例验证了算法对药物敏感性预测的可靠性。
- 孟德尔随机化确定关键致病基因:通过孟德尔随机化分析,确定 GALNT2 和 GYS1 为与肺腺癌发病相关的关键基因。GALNT2 的优势比(Odds Ratio,OR)为 1.3654,GYS1 的 OR 为 1.2668,且经过外部数据集验证。后续对 GYS1 的反向孟德尔随机化分析未发现其与肺腺癌存在反向因果关系,表明 GYS1 是肺腺癌发病和进展的重要风险因素。
- GYS1 对肺腺癌细胞的影响:实验表明,抑制 GYS1 可显著降低肺腺癌细胞(Calu - 3 和 PC - 9)的增殖、迁移和侵袭能力,同时减少细胞内糖原积累和 AGEs 产生,说明 GYS1 在促进肺腺癌细胞生长和转移过程中发挥重要作用。
研究结论与讨论
本研究构建了基于人工神经网络的糖基化预后模型,结合孟德尔随机化分析确定了 GALNT2 和 GYS1 等与肺腺癌发病相关的关键基因,并通过实验验证了这些基因在肺腺癌中的重要作用,为肺腺癌的治疗提供了新的潜在靶点和治疗思路。
糖基化修饰在肺腺癌的发生、发展、转移以及免疫逃逸等过程中起着至关重要的作用。异常糖基化不仅影响肿瘤细胞的生物学行为,还与肿瘤的诊断、预后和治疗密切相关。例如,一些糖蛋白的糖基化模式可作为肺癌诊断的生物标志物,而针对异常糖基化的治疗策略可能有效抑制肿瘤生长和转移。本研究中发现的高 GTs 恶性亚组具有独特的生物学特征,其在转移组织中的特异性分布以及与其他细胞的通讯模式,为深入理解肺腺癌转移机制提供了新视角。
GALNT2 作为糖基转移酶 2 蛋白家族成员,参与蛋白质糖基化过程,在肺癌发生发展中发挥重要作用。已有研究表明,它可通过激活 PI3K/Akt 和 MAPK/ERK 等信号通路促进 NSCLC 细胞的增殖和迁移,还参与肺癌对放疗的耐药过程。因此,GALNT2 有望成为肺腺癌治疗的重要靶点,针对其开发的靶向治疗药物可能为患者带来新的希望。
GYS1 作为糖原合成的关键酶,在多种癌症中发挥着不同作用。在肺腺癌中,抑制 GYS1 可显著抑制癌细胞的增殖、迁移和侵袭能力,减少糖原积累和 AGEs 产生。这表明靶向 GYS1 可能通过干扰癌细胞的能量代谢和相关信号通路,抑制癌细胞生长和转移,为肺腺癌治疗提供了新的策略。
然而,本研究也存在一定局限性。基于 GTs 的神经网络预后模型虽已在现有数据库中得到验证,但仍需更大规模的临床样本队列进一步验证。此外,GYS1 和 GALNT2 在肺腺癌中的具体作用机制还需更深入的研究。未来的研究可围绕这些方向展开,进一步探索糖基化修饰在肺腺癌中的奥秘,为开发更有效的治疗方法奠定基础,最终改善肺腺癌患者的预后和生活质量。