基于基底膜相关基因GPC2、UNC5D和SPOCK3的结直肠癌预后模型构建与验证

《European Journal of Medical Research》:Construction and validation of a prognostic model for colorectal cancer based on bioinformatics and basement membrane-related genes

【字体: 时间:2025年11月20日 来源:European Journal of Medical Research 3.4

编辑推荐:

  本研究针对结直肠癌(CRC)早期诊断困难、预后预测手段有限的问题,通过生物信息学方法筛选基底膜相关基因(BMRGs),构建了基于GPC2、UNC5D和SPOCK3的预后风险模型。研究发现这三个基因在癌组织中显著高表达,与CD4+T细胞浸润增加、CD8+T细胞减少及免疫功能障碍密切相关。通过多模型验证和免疫组化(IHC)证实其临床价值,为CRC预后预测和免疫治疗靶点开发提供了新思路。

  
在全球范围内,结直肠癌(Colorectal Cancer, CRC)始终是威胁人类健康的重大公共卫生问题。尤其在中国,其发病率高居第二位,死亡率位列第四,形势尤为严峻。更棘手的是,结直肠癌在早中期往往缺乏特异的临床表现,导致许多患者确诊时已错过最佳治疗时机,预后较差。因此,探寻新的、有效的预后生物标志物,对于指导临床治疗策略、改善患者生存结局具有至关重要的意义。
近年来,科学家们将目光投向了肿瘤微环境中一个看似简单却功能复杂的结构——基底膜(Basement Membrane, BM)。基底膜是位于上皮细胞和间质细胞之间的一层特化的细胞外基质(Extracellular Matrix),其主要成分包括层粘连蛋白、IV型胶原等。它不仅是维持组织结构的“支架”,更积极参与细胞信号传导、肿瘤血管生成、乃至肿瘤细胞的侵袭和转移过程。有研究表明,高达90%的癌症相关死亡与肿瘤细胞突破基底膜进行侵袭转移有关。然而,尽管基底膜相关基因(Basement Membrane-Related Genes, BMRGs)的重要性日益凸显,它们在结直肠癌发生发展中的具体作用,尤其是其作为预后预测指标的潜力,尚缺乏系统深入的研究。
为了解决这一科学问题,由Jiajie Wei、HuiQing Zhang和Xing Guo等研究人员组成的团队在《European Journal of Medical Research》上发表了他们的最新研究成果。他们巧妙地利用生物信息学(Bioinformatics)这一强大工具,结合临床样本验证,成功构建并验证了一个基于BMRGs的结直肠癌预后模型,为结直肠癌的精准医疗提供了新的视角和靶点。
为了开展这项研究,研究人员综合运用了多种关键技术方法。他们从TCGA-COAD和GEO等公共数据库获取了结直肠癌的转录组数据和临床信息,并利用单细胞RNA测序(single-cell RNA sequencing, scRNA-seq)数据(GSE132465)分析基底膜评分(BM score)在不同细胞类型中的分布。通过差异表达分析、单因素Cox回归、Lasso-Cox回归和随机生存森林(Random Survival Forest, RSF)等多种算法筛选与预后相关的关键BMRGs。进而构建多因素Cox比例风险回归模型(Cox regression model)计算风险评分(Riskscore),并建立临床预测模型。最后,他们收集了保定市第一中心医院的35例结直肠癌患者术后组织样本,通过免疫组织化学(Immunohistochemistry, IHC)染色对关键基因的表达进行了实验验证。
BMRG表达紊乱与肿瘤微环境
研究团队首先对单细胞数据进行了深入分析,将细胞注释为B细胞、上皮细胞、巨噬细胞、NK/T细胞、内皮细胞、成纤维细胞等七种主要类型。
分析发现,基底膜评分(BM score)在肿瘤样本中显著高于正常组织,并且主要富集在成纤维细胞和内皮细胞中。进一步的相关性分析显示,BM score与肿瘤样本中成纤维细胞(r=0.94, P<0.001)和内皮细胞(r=0.40, P<0.001)的比例呈显著正相关。
这表明BMRGs的表达紊乱与结直肠癌肿瘤微环境的重塑密切相关。
筛选关键预后基因并构建风险模型
通过对TCGA-COAD数据集中肿瘤与正常样本的差异表达分析,研究人员筛选出96个差异表达的BMRGs。随后,结合单因素Cox回归、Lasso-Cox和RSF三种算法进行交叉筛选,最终确定了三个关键的预后相关BMRGs:GPC2、UNC5D和SPOCK3。
基于这三个基因构建的多因素Cox回归模型风险评分公式为:Riskscore = 1.7883 × UNC5D表达量 + 1.3766 × SPOCK3表达量 + 0.6312 × GPC2表达量。根据中位风险评分将患者分为高风险组和低风险组,Kaplan-Meier生存曲线清晰显示,无论是在TCGA内部数据集还是外部验证数据集GSE103479中,高风险组患者的总生存期均显著短于低风险组。
构建最优临床预测模型
研究人员进一步将风险评分与临床病理特征(性别、年龄、TNM分期)相结合,构建临床预测模型。经过多种机器学习模型(如支持向量机SVM、随机森林、XGBoost和Cox模型)的训练和比较,
发现Cox模型在预测1年和3年生存率方面表现最佳,其Brier分数最低,决策曲线分析(Decision Curve Analysis, DCA)曲线也更优。
该模型在外部数据集GSE103479上也显示出良好的预测效能,1年、3年和5年生存率的曲线下面积(Area Under the Curve, AUC)分别为0.67、0.75和0.67。
高风险组免疫微环境特征
免疫浸润分析揭示了高风险组和低风险组之间显著的免疫微环境差异。
与低风险组相比,高风险组中CD4+T细胞的比例显著升高,而至关重要的CD8+T细胞比例则显著降低。在免疫功能方面,高风险组的抗原呈递细胞共刺激(APC co-stimulation)、CCR、MHC I类分子、Th1细胞和Th2细胞等相关功能评分均显著降低。此外,一些免疫检查点基因的表达也存在差异,例如TNFSF9在低风险组高表达,而BTNL2、ADORA2A等在高风险组表达更高。这提示高风险患者可能处于一种免疫抑制状态,对免疫治疗的反应可能不佳。
基底膜相关分子亚型
基于三个关键基因的表达谱,研究人员将结直肠癌患者分为两个不同的分子亚型(Cluster A和Cluster B)。
生存分析显示Cluster B亚型患者预后更差,其风险评分也更高,并且该亚型与淋巴结转移(N分期)显著相关。对两个亚型间的差异基因进行富集分析发现,这些基因主要富集在与细胞增殖、应激反应调控、 Wnt信号通路、IL-17信号通路以及PPAR信号通路等相关的生物学过程中。
这为了解不同亚型结直肠癌的发病机制提供了线索。
关键基因的实验验证
为了确认生物信息学分析的可靠性,研究团队对35对结直肠癌组织和癌旁正常组织进行了免疫组化染色。
结果明确显示,GPC2、UNC5D和SPOCK3三种蛋白在癌组织中的表达水平显著高于正常组织,其免疫组化评分(IHC score)具有统计学差异。这一实验证据有力地支持了生物信息学的发现,证实了这三个基因在结直肠癌中的异常高表达。
研究结论与意义
本研究成功识别并验证了GPC2、UNC5D和SPOCK3这三个基底膜相关基因作为结直肠癌新型预后生物标志物的价值。它们的高表达与患者不良预后、特定的免疫微环境抑制状态(如CD8+T细胞减少、免疫功能障碍)密切相关。基于这些基因构建的风险评分模型和临床预测模型,能够有效预测结直肠癌患者的生存结局。
该研究的创新之处在于系统性地揭示了基底膜相关基因在结直肠癌预后评估中的重要作用,并将生物信息学挖掘与临床样本验证相结合,增强了结论的可靠性。GPC2作为一种细胞膜表面的硫酸乙酰肝素蛋白聚糖,可能通过调控细胞生长信号通路促进肿瘤进展;SPOCK3作为细胞外基质糖蛋白,其过表达可能影响肿瘤细胞的生物学行为;而UNC5D作为Netrin-1的受体,其高表达可能通过干扰凋亡信号或调节免疫检查点(如PD-L1)参与肿瘤免疫逃逸。这些基因不仅可作为预后预测指标,更有潜力成为未来结直肠癌靶向治疗或免疫治疗的新靶点。当然,研究也存在一些局限性,例如关于UNC5D在结直肠癌中作用的争议仍需更多实验探索,以及长期随访数据的有限性等。总之,这项研究为结直肠癌的精准预后判断和个体化治疗策略的开发提供了重要的理论依据和实验基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号