《Frontiers in Immunology》:Identification of a lactylation-related gene signature in microsatellite stable gastric cancer based on bulk and single-cell RNA-seq
背景:卫星稳定型(MSS)胃癌(GC)对免疫治疗反应不佳且预后存在显著异质性。组蛋白乳酸化在肿瘤进展中发挥关键作用,然而乳酸化相关基因特征(LRGS)在MSS GC中的预后及治疗潜力尚不明确。方法:研究人员从The Cancer Genome Atlas(TCGA)和Gene Expression Omnibus(GEO)数据库获取MSS GC患者数据。基于乳酸化相关基因表达谱进行一致性聚类以对患者进行分层,并进一步采用机器学习算法构建LRGS。研究人员评估了LRGS与临床病理参数、肿瘤微环境(TME)及化疗敏感性的相关性,并采用肿瘤免疫功能障碍与排除(TIDE)算法预测潜在的免疫治疗反应。此外,研究整合了单细胞分析、细胞间通讯分析、计算机模拟基因敲除及免疫组织化学验证以探索关键基因的功能角色。结果:一致性聚类揭示了两个总体生存结局存在显著差异的亚群。研究建立了包含九个基因的LRGS,可有效将患者分为高风险组与低风险组。高风险组呈现免疫抑制性微环境、降低的化疗敏感性及更高的TIDE评分。单细胞分析显示LRGS评分在癌症相关成纤维细胞(CAFs)中最高,其中APOD在PDGFRA+ CAFs中高表达,SERPINE1在CA9+ CAFs中高表达。细胞间通讯分析表明这两种CAF亚型通过COLLAGEN和MIF通路呈现独特的信号模式。计算机模拟基因敲除进一步验证APOD和SERPINE1分别对其各自CAF亚型的基质重塑和缺氧适应至关重要。免疫组织化学分析证实APOD和SERPINE1在MSS GC中蛋白水平升高。结论:本研究开发并验证了一个稳健的MSS GC的LRGS,该特征有助于准确预后预测,并显示出预测化疗和免疫治疗反应的潜力。
胃癌(GC)是全球最常见的恶性肿瘤之一,持续高发病率和死亡率对公共卫生构成严重威胁。尽管手术、化疗、靶向治疗及免疫治疗等治疗手段近年取得一定进展,GC患者生存结局仍不理想,5年生存率不足30%。GC具有高度异质性,其发生发展涉及遗传变异、代谢异常及肿瘤微环境(TME)复杂调控等多因素。微卫星不稳定性(MSI)是GC的重要分子特征,通常由DNA错配修复系统功能障碍导致。研究表明,MSI-high GC患者对免疫治疗反应率较高,而MSS GC患者则对免疫治疗反应不佳。作为GC的主要亚型,MSS GC以免疫抑制性TME为特征,表现为免疫细胞浸润不足及免疫逃逸,这些特征导致治疗选择有限且预后普遍较差。因此,深入研究MSS GC的分子机制并开发能够预测预后和免疫治疗反应的生物标志物对指导个体化治疗具有重要意义。
乳酸代谢在TME调控中的作用近年受到广泛关注。乳酸不仅是糖酵解终产物,还通过组蛋白乳酸化等表观遗传修饰机制参与肿瘤增殖、转移和免疫调节。近期研究揭示AARS1作为乳酸转移酶催化YAP-TEAD乳酸化从而促进GC增殖;组蛋白乳酸化还可上调METTL3表达,促进肿瘤增殖同时抑制CD8
+ T细胞细胞毒性;此外还能促进FAP转录及细胞外基质重塑,导致CD8
+ T细胞排斥及免疫抑制微环境形成。这些发现提示乳酸化可能为MSS GC的预后和免疫治疗反应提供信息。为探索这一问题,研究人员构建了乳酸化相关基因特征(LRGS),系统表征其在TME、化疗敏感性和免疫治疗敏感性等关键维度的异质性,并在单细胞分辨率验证其细胞学基础。鉴于细胞间通讯在肿瘤进展中的关键作用,研究人员还进行了细胞间通讯分析,并采用计算机模拟基因敲除(in silico KO)预测关键基因的功能角色。
研究人员开展的研究数据来源包括:从TCGA数据库下载胃腺癌(STAD)数据集,包含448例患者的转录组数据,经筛选后获得314例MSS GC肿瘤样本;从GEO数据库获取GSE62254数据集作为外部验证队列;从既往研究获取乳酸化相关基因列表。乳酸化相关基因来自先前发表的研究文献。
在技术方法层面,研究人员首先进行一致性聚类分析,采用R包"ConsensusClusterPlus"对乳酸化相关基因进行无监督聚类,最大聚类数设为9,重采样迭代1000次以评估聚类稳定性并确定最优K值。随后采用CIBERSORT算法量化22种免疫细胞类型的浸润水平,采用ESTIMATE算法计算ImmuneScore、StromalScore和ESTIMATEScore以全面评估TME组成。为构建LRGS,研究人员采用DESeq2进行差异表达基因(DEGs)分析,筛选标准设定为|log
2FC| > 1且校正p值 < 0.05;采用LASSO回归降维获得15个候选基因;进而整合10种机器学习算法(包括plsRcox、RSF、CoxBoost、Enet、GBM、survival-SVM、SuperPC、StepCox、Ridge和LASSO)生成101种算法组合,采用"Mime1" R包实施并以一致性指数(C-index)评估,最终选择平均C-index最高的SuperPC模型构建LRGS。免疫治疗反应预测采用TIDE算法;化疗敏感性预测采用"oncoPredict" R包基于Genomics of Drug Sensitivity in Cancer数据库的药物敏感性模型预测半数抑制浓度(IC
50)。单细胞分析采用GEO数据库GSE183904数据集,使用Seurat R包(版本5.4.0)进行标准化分析,质量控制标准为:基因表达数少于200或多于6000、线粒体基因百分比超过10%的细胞被排除;采用"NormalizeData"函数对数标准化,选取前3000个高变基因进行主成分分析降维,采用"harmony"包去除批次效应,使用均匀流形近似与投影(UMAP)可视化,基于典型标志物注释细胞群,采用"AddModuleScore"计算LRGS基因的模块评分。细胞间通讯分析采用CellChat算法,基于质量作用定律和配体-受体对表达水平推断细胞间通讯概率并预测相关信号通路,应用模式识别分析细胞子群的全局通讯特征,对关键通路进行深入网络构建和功能角色量化。计算机模拟基因敲除分析采用"scTenifoldKnk" R包,从单细胞转录组数据构建基因调控网络,通过模拟敲除状态识别下游差异表达基因,进而进行功能富集分析。免疫组织化学验证采用2025年1月至5月期间10对MSS GC及配对癌旁正常组织标本,标本来源于福州大学附属省级医院术后患者,经医院伦理委员会批准(批准号:K2026-05-021),使用APOD抗体(Proteintech, 10520-1-AP, 1:400)和SERPINE1抗体(Proteintech, 13801-1-AP, 1:400)进行染色,由两名经验丰富的病理学家独立评分。
研究结果部分,一致性聚类相关分析显示:乳酸化相关基因单因素Cox回归分析筛选出10个与预后显著相关的基因;一致性聚类确定将患者分为两个亚群最优,Kaplan-Meier分析表明C1亚群总体生存显著优于C2亚群;ESTIMATE算法显示C2亚群ImmuneScore、StromalScore和ESTIMATEScore均显著更高;CIBERSORT分析显示C2亚群中静息树突状细胞、嗜酸性粒细胞、M2巨噬细胞、静息肥大细胞、单核细胞、活化NK细胞和CD8
+ T细胞等七种免疫细胞浸润水平更高;差异表达分析鉴定出1228个DEGs,其中256个在C1上调、972个在C2上调;功能富集分析显示C2上调基因显著富集于细胞外基质组织、细胞外结构组织和肌肉系统进程等通路。
LRGS构建与验证结果显示:从380个候选基因经LASSO降维至15个,再经101种机器学习组合筛选,SuperPC模型以平均C-index 0.62被确定为最优模型;LRGS包含ABCB5、APOD、AXIN2、CYTL1、GFAP、NGF、SERPINE1、SLC5A5和SYT6共9个基因;Sankey图显示C2亚群与更高风险评分及更差预后相关;热图显示9个LRGS基因大多在高风险组上调,且风险组间T分期分布存在显著差异;Kaplan-Meier生存分析证实低风险组总体生存显著更优;单因素和多因素Cox回归分析确认LRGS为独立于年龄、性别和TNM分期的预后因素,上述发现在GSE62254验证数据集中得到复现。
基于LRGS的TME分析表明:高风险组ImmuneScore、StromalScore和ESTIMATEScore均高于低风险组;免疫检查点相关基因在两组间差异表达,大多数在高风险组表达更高;LRGS与CD4
+记忆活化T细胞、活化树突状细胞、M0巨噬细胞、中性粒细胞、滤泡辅助性T细胞、活化肥大细胞和静息NK细胞呈负相关,与静息肥大细胞、单核细胞、M2巨噬细胞和活化NK细胞呈正相关。
免疫治疗与化疗反应预测结果显示:低风险组对奥沙利铂、喜树碱、5-氟尿嘧啶、多西他赛、顺铂、紫杉醇、伊立替康和环磷酰胺等常用化疗药物的IC
50值更低,提示该组可能从化疗中获益更多;TIDE评分显示高风险组TIDE、Dysfunction和Exclusion评分显著更高,而低风险组MSI评分显著更高,提示LRGS可能有助于预测MSS GC的免疫治疗反应。
单细胞RNA测序分析揭示:经标准化和Seurat流程分析,纳入正常组织、MSS GC和MSI GC三种样本类型,鉴定出上皮细胞、成纤维细胞、内皮细胞、淋巴细胞、髓系细胞和浆细胞六种细胞类型;MSS样本中淋巴细胞比例低于MSI样本,而CAFs比例更高;APOD主要在CAFs中表达,SERPINE1在CAFs和内皮细胞中均高表达;MSS GC组织中CAF群体LRGS评分高于其他细胞类型。CAF亚群分析进一步重聚类鉴定出四个CAF亚型以及周细胞和间皮细胞:PDGFRA
+ CAFs、CA9
+ CAFs、COL10A1
+ CAFs和PI16
+ CAFs;PDGFRA
+ CAFs表现出最高LRGS评分,APOD特异性表达于该亚型,功能富集于细胞外基质相关通路;CA9
+ CAFs高表达SERPINE1,功能关联细胞质翻译、核糖核蛋白复合体生物合成和缺氧反应等通路;COL10A1
+ CAFs富集高尔基体囊泡运输和RNA剪接,PI16
+ CAFs富集细胞外基质组织和超分子纤维组织调控。
细胞间通讯分析表明:CA9
+ CAFs与PDGFRA
+ CAFs连接最强,PDGFRA
+ CAFs也与内皮细胞和上皮细胞有显著相互作用;在COLLAGEN通路中,PDGFRA
+ CAFs主要作为信号受体,CA9
+ CAFs作为主要发送者,PDGFRA
+ CAFs与髓系细胞连接强烈;在MIF通路中,PDGFRA
+ CAFs展现多功能角色,在受体、介导者和影响者维度具有最高中心性,与淋巴系和髓系细胞广泛连接,CA9
+ CAFs则主要作为信号发送者。
计算机模拟基因敲除分析显示:APOD敲除扰动57个下游基因,显著富集于细胞外基质组织和细胞运动调控通路;SERPINE1敲除扰动66个下游基因,主要影响细胞对缺氧反应和葡萄糖代谢等生物学过程。
免疫组织化学分析证实:APOD和SERPINE1阳性染色主要定位于细胞质;MSS GC中两者表达显著高于配对癌旁正常组织,IHC评分差异具有统计学意义。
讨论部分,研究人员指出MSS GC作为GC的主要亚型,其低免疫治疗反应率仍是临床管理的主要挑战。该亚型内部存在显著分子异质性,深刻影响患者预后和治疗敏感性,但其背后的调控网络及免疫抑制微环境形成机制尚不充分明了。越来越多的证据表明肿瘤进展受代谢重编程、表观遗传调控和翻译后修饰的复杂协同控制。本研究聚焦乳酸化相关基因在MSS GC中的作用,通过系统分析开发并验证了九基因LRGS。该特征不仅能稳定预测患者结局,在多因素分析中被证实为独立预后因素,其风险分层还与化疗敏感性和特定免疫微环境特征显著相关,提示乳酸化可能在调控MSS GC治疗反应中发挥关键作用。
LRGS包含的九 genes涵盖关键调控因子SERPINE1和APOD,以及参与多种致癌过程的NGF、AXIN2和ABCB5等。SERPINE1作为关键纤溶调控因子,在癌症中频繁过表达,通过诱导上皮-间质转化促进GC进展;APOD作为关键脂质代谢调控因子,与不良预后和免疫治疗抵抗显著相关。LRGS在训练数据集中表现稳定,能有效将患者分为高风险组和低风险组,两组总体生存差异显著,且在独立验证数据集中保持良好可重复性。多因素分析确认LRGS为显著独立预后因素,为TNM分期等传统临床参数提供额外预测价值。
基于LRGS预后价值的验证,研究进一步评估其在预测化疗和免疫治疗反应方面的潜在临床效用。分析显示低风险组具有更有利的免疫特征,对奥沙利铂和5-氟尿嘧啶等常用化疗敏感性更高;高风险组则TIDE评分升高、多种免疫检查点上调、M2巨噬细胞极化,共同塑造了驱动肿瘤进展并导致免疫治疗抵抗的免疫抑制微环境。值得注意的是,主要对应高风险表型的C2亚群还表现出CD8
+ T细胞和活化NK细胞浸润增加,这种表面矛盾可通过细胞毒性淋巴细胞的功能损伤和空间排斥解释:高风险组呈现显著升高的基质评分和CAF富集,提示CAFs可能形成致密结构屏障,将CD8
+ T细胞和NK细胞禁锢于肿瘤周围基质中,阻止其向肿瘤核心浸润,导致其虽有数量优势却无法发挥抗肿瘤效应。这与乳酸化调控TME的机制一致,关键基因SERPINE1已被证实与免疫抑制微环境形成密切相关。
为探索这些观察的细胞学基础,研究进一步鉴定了四个功能独特的CAF亚型。单细胞亚群分析将LRGS关键基因映射至特定功能CAF亚型:APOD主要表达于PDGFRA
+ CAFs,该亚型富集于细胞外基质组织和TGF-β信号通路,呈现肌成纤维细胞样和炎性成纤维细胞混合表型,与既往报道的MMP1
+肌成纤维细胞群体一致,该群体促进免疫抑制微环境形成和免疫治疗抵抗;SERPINE1特异性表达于CA9
+ CAFs,该亚型富集于缺氧反应、核糖体生物合成和代谢重编程通路,功能上类似报道的代谢型CAFs,可能介导反向Warburg效应并通过代谢重编程为癌细胞供能,促进肿瘤进展和治疗抵抗。细胞间通讯分析进一步揭示这两种CAF亚型的独特信号模式:PDGFRA
+ CAFs在COLLAGEN通路中主要作为信号受体、在MIF通路中作为多功能调控者,广泛连接髓系和淋巴系细胞;CA9
+ CAFs则主要作为信号发送者。COLLAGEN通路已被证实可形成限制T细胞向肿瘤巢浸润的物理屏障,导致TME中免疫排斥;MIF信号则可能促进M2巨噬细胞极化和T细胞耗竭,促进免疫抑制环境以支持GC进展和免疫治疗抵抗。计算机模拟基因敲除分析验证APOD和SERPINE1分别对细胞外基质重塑和缺氧适应至关重要,直接支持其作为各自CAF亚型关键驱动因子的功能角色。此外,研究还鉴定了以PI16、MFAP5和CD34高表达为特征的CAF亚型,其基因特征提示可能代表成纤维细胞前体或祖细胞状态;以及富集于细胞外基质组织和Wnt信号通路的COL10A1
+ CAFs。这些发现共同描绘了MSS GC中CAFs的高度异质性和复杂功能分工。
本研究的主要创新在于聚焦免疫治疗反应不佳、治疗选择有限的MSS GC队列,开发LRGS以实现精准风险分层。LRGS不仅提供了理解MSS GC肿瘤异质性和预后差异的新代谢视角,还可作为制定个体化治疗策略的潜在指导。研究的局限性包括:免疫组织化学验证样本量相对较小,且未在蛋白水平分析关键基因表达与免疫细胞浸润的相关性;单细胞分析仅依赖一个公共数据集,可能影响其普适性;计算机模拟基因敲除预测未经验证;基于TIDE算法的免疫治疗反应预测纯为计算性,缺乏真实世界临床队列验证。未来多中心前瞻性临床研究有待进一步验证该特征的稳健性和适用性,并阐明所涉关键基因的乳酸化驱动调控机制。该特征有望为不同风险群体的个体化治疗策略制定提供有价值的基础。
结论部分翻译如下:本研究基于乳酸化相关基因开发了LRGS,能够有效实现MSS GC患者的风险分层和结局预测,并显示出预测治疗反应的潜在价值。至关重要的是,单细胞分析为LRGS提供了细胞学基础,将其关键基因与特定功能CAF亚型相联系。未来有待开展多中心前瞻性临床研究以进一步验证该特征的稳健性和适用性,并阐明所涉关键基因的乳酸化驱动调控机制。该特征有望为不同风险群体制定个体化治疗策略提供有价值的依据。