整合转录组与孟德尔随机化分析揭示肺癌预后、免疫应答及药物敏感性的新基因标志物

《Hormones & Cancer》:Integrating differential gene expression and Mendelian randomization analyses reveal novel gene for prognosis, immune response, and drug sensitivity in lung cancer

【字体: 时间:2025年12月20日 来源:Hormones & Cancer

编辑推荐:

  本研究为应对肺癌异质性高、缺乏有效生物标志物的挑战,通过整合差异表达基因(DEGs)与孟德尔随机化(MR)分析,识别出11个与肺癌风险存在潜在因果关联的基因(如SAPCD2、SPP1)。研究构建了7基因预后风险评分,可独立预测患者生存、免疫逃避(TIDE评分)及药物敏感性,为肺癌精准治疗提供了新见解。

  
肺癌是全球癌症相关死亡的主要原因,每年导致约180万人死亡,尽管在靶向治疗和免疫治疗方面取得了进展,但患者总体预后仍然较差。治疗该疾病的核心挑战在于其深刻的肿瘤间和肿瘤内异质性,这导致了治疗反应的差异性,以及对常规化疗、靶向药物甚至现代免疫疗法几乎不可避免的耐药性出现。这些复杂性凸显了对能够实现早期诊断、改善患者分层、预测结果和指导个性化治疗策略的稳健生物标志物的迫切需求。
高通量转录组学的出现使得能够识别恶性和非恶性肺组织之间数千个差异表达基因(Differentially Expressed Genes, DEGs),为了解该疾病的分子景观提供了宝贵见解。然而,这些发现大多是描述性的。转录组分析的观察性性质使得难以区分因果驱动因素与相关信号。因此,许多DEGs未能转化为临床上有意义的生物标志物或治疗靶点,导致了昂贵但无果的后续研究。
为了克服这一基本挑战,孟德尔随机化(Mendelian Randomization, MR)提供了一个强大的分析框架,用于从观察数据中推断潜在的因果关系,特别是在多组学整合的背景下。通过利用种系遗传变异作为基因表达的无混杂工具变量,MR可以评估转录水平对疾病风险的终生影响,从而减少传统流行病学研究中存在的反向因果关系和混杂偏倚。虽然MR在肿瘤学中的应用势头强劲,但一个关键的知识差距仍然存在。很少有研究将其研究范围扩展到初步识别因果基因之外,去系统地表征这些基因的功能作用、它们与肿瘤免疫微环境的相互作用,以及它们作为预后和预测性生物标志物的最终临床相关性。
因此,本研究旨在通过一个多阶段、整合性的分析来弥合这一差距。研究人员试图超越简单的关联分析,首先利用两样本MR方法识别与肺癌风险存在遗传预测因果关联的转录本。随后,通过检查这些基因的功能通路、它们与免疫细胞浸润的相关性,以及在独立TCGA队列中作为预后标志物的有效性,旨在阐明这些基因的生物学和临床相关性。最后,探索了它们预测免疫逃避和对各种治疗药物敏感性的潜力。通过建立从因果基因到临床结果的更清晰联系,这项工作旨在提供一组经过高度验证的生物标志物,并揭示肺癌中新的治疗脆弱性。
为了开展研究,研究人员从GEO数据库获取了三个基因表达数据集(GSE19804, GSE18842, GSE19188),并使用ComBat算法进行批次校正。通过limma包进行差异表达分析,识别DEGs。孟德尔随机化分析使用IEU OpenGWAS项目中的顺式表达数量性状位点(cis-eQTLs)数据作为暴露,芬兰FinnGen联盟(R10版)的肺癌GWAS摘要数据作为结局。采用逆方差加权法(Inverse-Variance Weighted, IVW)作为主要估计方法,并进行敏感性分析(如MR-Egger回归)以确保结果的稳健性。对重叠基因进行了基因本体论(Gene Ontology, GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析。使用CIBERSORT算法估计免疫细胞浸润比例。在TCGA肺癌队列中验证基因表达差异,构建预后风险评分模型,并评估其与肿瘤免疫功能障碍和排斥(Tumor Immune Dysfunction and Exclusion, TIDE)评分以及药物敏感性(使用oncoPredict R包预测)的关联。
3.1 批次校正与DEGs识别
研究人员从三个GEO数据集中获得了367个样本的表达数据。使用ComBat函数成功去除了批次效应。差异基因表达分析共识别出1193个符合筛选标准(|logFC| > 1 且 adj.P.Val < 0.05)的基因,其中409个在肿瘤组中上调,784个下调。
3.2 通过孟德尔随机化识别与肺癌相关的基因
为了探索因果关系,研究人员将识别出的DEGs与肺癌GWAS摘要统计数据整合,以研究这些基因与肺癌的潜在因果关联。在所研究的转录本中,有253个在多重检验校正后显示出与肺癌风险显著的遗传预测关联,其中118个增加风险,135个具有保护作用。值得注意的是,两个在肿瘤中上调的基因(SAPCD2和SPP1)显示出正向的因果效应。相反,九个在肿瘤中下调的基因(GPX3, C1orf162, CTSW, TPSAB1, CD93, HK3, TFPI, NEBL, STEAP4)与风险呈负相关。敏感性分析支持了这些发现的稳健性。
3.3 重叠基因的功能表征
研究人员随后聚焦于识别出的11个重叠基因,进行了GO和KEGG富集分析。这些基因主要富集在与细胞组分相关的通路中,顶级通路包括纤维胶凝蛋白1富集的颗粒、分泌颗粒腔、细胞质囊泡腔和一般囊泡腔,其中HK3、CTSW、CD93是参与这些功能的目标基因。此外,四个与NEBL相关的GO通路被富集。同时,两个与分子功能相关的通路,包括碳水化合物结合和内肽酶活性,也在这些基因中富集。KEGG富集分析发现这些基因主要富集于半乳糖代谢、果糖和甘露糖代谢、核苷酸糖的生物合成以及淀粉和蔗糖代谢通路,突出了肺癌中复杂碳水化合物代谢的潜在扰动。GSEA分析发现,在HK3、CD93和CTSW高表达的基因集中,细胞因子-细胞因子受体相互作用等免疫相关通路被激活。
3.4 免疫景观与重叠基因的相关性
使用CIBERSORT算法估计了22种免疫细胞类型的相对比例。结果显示,两组之间主要免疫细胞类型的整体组成存在显著差异。具体而言,治疗组表现出更高比例的浆细胞、CD4初始T细胞、调节性T细胞(Tregs)、M0巨噬细胞和静息树突状细胞,而CD8 T细胞、单核细胞、静息肥大细胞、嗜酸性粒细胞和中性粒细胞相对减少。进一步探索候选基因与免疫细胞比例的相关性发现,SAPCD2和SPP1的表达与在治疗组中富集的免疫细胞呈正相关。相反,在MR分析中与肺癌风险呈负相关的基因,其表达水平与在对照组中更丰富的免疫细胞呈正相关。
3.5 在TCGA数据中验证重叠基因
研究人员在TCGA的独立肺癌队列中验证了这11个重叠基因的差异。所有11个基因在对照组和癌症组之间均存在显著差异,且方向与上述MR和差异分析结果一致。通过单变量生存分析(Cox回归),发现这11个基因中有7个其表达水平与肺癌患者的生存期相关。基于这7个基因构建了预后风险评分,并根据风险评分中位数将患者分为高风险组和低风险组。高风险组患者的生存率显著低于低风险组。在多变量生存分析中,调整了年龄、性别和癌症分期后,构建的风险评分仍然与肺癌患者的生存率独立相关。
3.6 风险评分与免疫逃避、免疫治疗反应和药物敏感性的关联
通过计算TIDE评分,评估了两个风险组之间免疫逃避潜力和免疫治疗反应的差异。结果显示,高风险组肺癌患者的TIDE评分显著更高,表明该组具有增强的免疫逃避潜力,可能对免疫检查点阻断疗法的反应较差。此外,全面的药物敏感性分析发现,在测试的198种药物中,有128种在高风险和低风险组之间表现出显著的IC50值差异。例如,PRT062607、Doramapimod、GSK343、Ribociclib和Leflunomide是对高风险组肺癌患者敏感性最高的五种药物,而Elephantin、BI-2536、AZ960、SCH772984和MG-132是对低风险组患者敏感性最高的五种药物。
这项综合性、多阶段研究整合了转录组学、基因组学和临床数据,识别并验证了与肺癌有因果作用的转录本。通过差异分析和MR,研究人员将一长串差异表达基因缩小到一个包含11个候选基因的高置信度集合,这些基因与肺癌风险存在遗传预测的因果效应。对这些候选基因的后续表征阐明了癌细胞遗传学、肿瘤免疫微环境、患者预后和治疗脆弱性之间复杂的相互作用。
研究确定了SPP1(骨桥蛋白)和SAPCD2作为肺癌中潜在的因果致癌基因,强调了它们在驱动肿瘤发生中的关键作用。同时,研究的一个有趣发现是几个推定的肿瘤抑制基因(如GPX3、NEBL和TFPI)所呈现的看似矛盾的作用。虽然MR分析发现这些基因对发生肺癌的风险具有保护作用,但它们在已形成肿瘤中的较低表达却矛盾地与更好的患者生存率相关。这种基因作用在癌症发生和进展之间出现分歧的复杂关系,反映了肿瘤发生的动态和适应性本质。
通过整合免疫细胞,研究结果指出肺癌的发展与肿瘤免疫景观重塑为一个免疫抑制和髓系偏向的生态位有关。研究中确定的因果基因似乎是这种免疫学转变的关键协调者。例如,促癌基因SPP1的表达与肿瘤浸润的M0巨噬细胞呈强正相关,与CD8+ T细胞呈负相关。相反,保护性基因如TFPI与在肿瘤中耗竭的免疫细胞呈正相关,强调了它们在维持抗肿瘤状态中的潜在作用。
这些发现的临床转化通过7基因预后风险评分得到体现。该模型成功地对肺癌患者进行了分层,其预测能力独立于年龄、性别和传统癌症分期。高风险组显著更高的TIDE评分表明该组倾向于对免疫治疗耐药。此外,风险评分可作为预测性生物标志物,指导个性化化疗和靶向治疗。全面的药物敏感性分析揭示了两个风险组之间独特且通常相互排斥的治疗脆弱性。
总之,通过以孟德尔随机化为锚点的综合多组学整合分析,本研究识别并验证了11个在肺癌中具有因果作用的基因,阐明了如SPP1和SAPCD2等癌基因的潜在促肿瘤机制,并 notably 揭示了推定的肿瘤抑制因子如GPX3和TFPI在癌症发生与进展中的复杂、矛盾功能。基于已识别基因表达水平构建的预后风险评分不仅能独立预测患者生存和对免疫治疗的潜在耐药性,最关键的是,能将患者分层为具有不同治疗脆弱性的亚组。虽然进一步的实验验证对于临床转化至关重要,但这项工作提供了一个强大的框架,将因果遗传风险与肿瘤微环境和治疗反应联系起来,为开发新颖的、生物标志物指导的策略以改善肺癌患者预后提供了切实的、数据驱动的假设。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号