基于多组学与孟德尔随机化的棕色脂肪细胞相关基因在结直肠癌中的预后价值研究
《Hormones & Cancer》:Prognostic value of brown adipocyte-related genes in colorectal cancer: a multi-omics and Mendelian randomization study
【字体:
大
中
小
】
时间:2025年12月15日
来源:Hormones & Cancer
编辑推荐:
本研究针对棕色脂肪细胞相关基因(BARGs)在结直肠癌(CRC)预后机制不清的问题,通过整合TCGA、GEO和IEU OpenGWAS数据库,采用差异表达分析、WGCNA、孟德尔随机化(MR)和机器学习算法,鉴定出ADD2、PDE1B、LZTS1和PCSK5四个关键预后基因,构建的预后模型和列线图在训练集和验证集中AUC均>0.8,显示其精准预测能力。研究还揭示了这些基因与免疫微环境、肿瘤突变负荷(TMB)和药物敏感性的关联,为CRC的预后评估和精准治疗提供了新视角。
在全球范围内,结直肠癌(Colorectal Cancer, CRC)是消化系统最常见且致命的恶性肿瘤之一,其发病率和死亡率呈上升趋势。这种起源于结肠或直肠上皮细胞不受控增殖的疾病,受到遗传易感性和环境因素(如高脂饮食、慢性炎症、久坐生活方式和基因突变)复杂相互作用的驱动。尽管在早期检测、手术干预和系统性治疗(如化疗、靶向治疗和免疫治疗)方面取得了进展,但结直肠癌仍构成严峻的临床挑战,特别是在晚期阶段,肿瘤异质性、转移潜力和治疗耐药性导致其五年生存率依然很低。这些持续存在的障碍凸显了对新型预后生物标志物和治疗靶点的迫切需求,以改善结直肠癌的管理和患者结局。
棕色脂肪组织(Brown Adipose Tissue, BAT)因其独特的代谢特性及其在肿瘤生物学中的潜在作用而受到越来越多的关注。与主要作为能量储存库的白色脂肪组织不同,棕色脂肪组织通过线粒体解偶联蛋白1(Uncoupling Protein 1, UCP1)介导的产热作用主动消耗能量。这种代谢活动有助于全身能量稳态,并已被牵涉到各种病理状况中。有证据表明,脂肪细胞通过调节肿瘤微环境(Tumor Microenvironment, TME)中的脂质代谢、细胞因子信号传导和免疫细胞募集来影响肿瘤进展。尽管关于棕色脂肪组织在结直肠癌中作用的直接研究有限,但在具有相似代谢特征的癌症中的研究,如肝细胞癌和胰腺癌,已表明其参与肿瘤发生。此外,棕色脂肪组织激活会增加能量消耗,从而减少体重增加,而肥胖与结直肠癌等相关,减肥手术可降低结直肠癌发病率。尽管有这些见解,棕色脂肪细胞相关基因(Brown Adipocyte-Related Genes, BARGs)促进结直肠癌发病机制的具体机制仍知之甚少,这一关键的知识空白可能揭示新的预后和治疗靶点。
孟德尔随机化(Mendelian Randomization, MR)是一种强大的流行病学技术,它利用遗传变异作为工具变量来建立风险因素与疾病结局之间的潜在因果关系。该方法基于三个关键假设:(1)遗传变异应与感兴趣的风险因素有强相关性(相关性假设);(2)它必须与混杂变量无关(独立性假设);(3)其对结局的影响必须仅通过该风险因素发生,没有其他因果途径(排他性限制假设)。与传统的观察性研究相比,孟德尔随机化可以减少混杂偏倚并减轻反向因果关系的影响。近期基于孟德尔随机化的研究已成功识别出与结直肠癌易感性和进展相关的代谢和免疫相关基因。利用孟德尔随机化来探索棕色脂肪组织相关基因与结直肠癌之间的关系,可能为该疾病的代谢机制提供有价值的见解,并识别有前景的治疗靶点。
本研究旨在系统性地探讨BARGs在结直肠癌中的预后价值及其潜在机制。研究人员整合了来自癌症基因组图谱(The Cancer Genome Atlas, TCGA)、基因表达综合数据库(Gene Expression Omnibus, GEO)和IEU OpenGWAS数据库的转录组数据,通过差异表达分析、加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)、孟德尔随机化分析和机器学习算法,筛选出关键的预后基因,并构建和验证了预后模型。此外,还进行了功能富集分析、免疫浸润表征、肿瘤突变负荷(Tumor Mutation Burden, TMB)评估和药物敏感性评估,以探索潜在的机制 insights。
本研究主要运用了多数据库整合分析、差异表达分析、WGCNA、孟德尔随机化(MR)、生存分析(Cox回归、KM曲线)、机器学习算法(LASSO回归、随机生存森林RSF)、免疫浸润分析(ssGSEA、CIBERSORT、ESTIMATE)、体细胞突变分析、药物敏感性预测(pRRophetic包)、基因集富集分析(GSEA)以及体外细胞功能实验(qRT-PCR、CCK-8、划痕实验、Transwell实验)等关键技术方法。样本数据主要来源于公共数据库TCGA(包含669个样本,其中618个结直肠癌肿瘤组织和51个癌旁正常组织)和GEO(GSE12945数据集,62个结直肠癌肿瘤组织样本),以及结直肠癌细胞系(HCT116, SW480, DLD-1)和正常肠上皮细胞系NCM460。
在TCGA-CRC数据集中,共筛选出9375个差异表达基因(DEGs),其中在CRC样本中上调基因5611个,下调基因3764个。
根据BARGs评分的最佳截断值将CRC样本分为高分组和低分组,Kaplan-Meier生存曲线显示BARGs评分与CRC患者的生存显著相关。通过WGCNA分析,确定了16个基因共表达模块,其中MEblue模块与BARGs评分相关性最高(cor=0.7227, P<0.001),被确定为关键模块,包含2335个关键模块基因。
将9375个DEGs与2335个关键模块基因取交集,获得1256个候选基因。
富集分析表明,这些候选基因显著富集于1658个GO条目(如肌肉收缩)和63个KEGG通路(如PI3K-Akt信号通路),提示其与肌肉生理、细胞外结构和细胞信号转导密切相关。蛋白质-蛋白质相互作用(PPI)网络分析显示,PRKG1、COL5A2等基因与其他基因高度关联。
孟德尔随机化分析显示,在1256个候选基因中,有256个基因与CRC存在显著的因果关系(PIVW< 0.05),其中135个为风险因素,121个为保护因素。以PCSK5为例,其OR值为1.117(95% CI: 1.075-1.161, P<0.001),表明是风险因素。
经过异质性检验、水平多效性检验、留一法(Leave-One-Out, LOO)检验和Steiger方向性检验等敏感性分析后,最终保留了168个特征基因用于后续分析。
对168个特征基因进行单变量Cox回归分析和比例风险(Proportional Hazards, PH)假设检验后,得到11个基因。通过比较其风险比(Hazard Ratio, HR)与MR分析中的比值比(Odds Ratio, OR)趋势,并经过LASSO回归分析,最终确定了4个预后基因:ADD2、PDE1B、LZTS1和PCSK5,并构建了预后模型。
随机生存森林(Random Survival Forest, RSF)模型显示LZTS1的重要性最高。根据风险评分的最佳截断值(22.28456),将TCGA-CRC数据集中的患者分为高风险组(HRG, N=211)和低风险组(LRG, N=374)。高风险组预后较差,且四个预后基因的表达水平更高。Kaplan-Meier生存曲线和受试者工作特征(Receiver Operating Characteristic, ROC)曲线(1年、2年、3年AUC分别为0.84、0.88、0.86)验证了模型的有效性。在独立验证集GSE12945中也得到了类似的结果,证明了模型的普适性。
单因素和多因素Cox回归分析确定年龄、分期、病理M分期、病理N分期和风险评分是独立的预后因素。基于此构建的列线图,其校准曲线斜率接近1,1年、2年、3年预测的ROC曲线下面积(AUC)分别高达0.90、0.91和0.92,显示出极高的预测精度。风险评分在病理T分期、N分期、M分期和临床分期各亚组间存在显著差异,但在年龄和性别亚组间无显著差异。
免疫浸润分析发现,高风险组和低风险组之间有16种免疫细胞的浸润丰度存在显著差异,且高风险组中所有这些差异免疫细胞的富集分数均高于低风险组。16种差异免疫细胞彼此间呈正相关,其中巨噬细胞与髓源性抑制细胞(Myeloid-Derived Suppressor Cells, MDSCs)的正相关性最强(cor=0.93)。预后基因主要与差异免疫细胞呈正相关,其中PDE1B与调节性T细胞(Regulatory T cells, Tregs)的正相关性最显著(cor=0.70)。ESTIMATE分析显示高风险组的基质评分和ESTIMATE评分显著更高。CD276、HHLA2、VSIR等多个免疫检查点分子在高风险组和低风险组间的表达也存在显著差异。
体细胞突变分析显示,APC、TP53、TTN和KRAS是高风险组和低风险组中突变频率最高的基因。风险评分与肿瘤突变负荷(TMB)呈弱正相关(cor=0.11, P=0.011),但两组间TMB无显著差异。微卫星不稳定性(Microsatellite Instability, MSI)评分与风险评分呈负相关(cor=-0.085, P=0.04),低风险组的MSI评分更高。药物敏感性分析表明,多种化疗药物(如AZD1332、BMS.754807、Dasatinib等)对低风险组患者的治疗效果更显著。结直肠癌一线药物厄洛替尼(Erlotinib)和奥沙利铂(Oxaliplatin)在低风险组中也表现出更高的敏感性。
基因集富集分析(GSEA)显示,高风险组和低风险组之间共有71条通路显著富集,包括细胞粘附分子(Cell Adhesion Molecules, CAMs)、粘着斑(Focal Adhesion)等通路,提示细胞微环境重塑和细胞迁移调控在结直肠癌免疫微环境中可能具有重要影响。
通过生物信息学预测构建了针对四个预后基因的lncRNA-miRNA-mRNA调控网络。人类蛋白质图谱(HPA)数据库的免疫组化结果和TCGA数据集的表达分析显示,与正常组织相比,LZTS1在结直肠癌组织中表达上调,而ADD2、PDE1B和PCSK5表达下调。在结直肠癌细胞系中的qRT-PCR验证结果与TCGA数据分析结果一致。
基于UALCAN数据库分析发现PCSK5高表达与患者较差生存相关,且其在癌组织中表达下调。选择PCSK5进行功能验证,siRNA干扰敲低PCSK5后,HCT116和SW480细胞的增殖、迁移和侵袭能力均显著减弱。
本研究通过整合多组学数据和孟德尔随机化方法,首次系统性地揭示了棕色脂肪细胞相关基因在结直肠癌中的预后价值。研究成功鉴定出ADD2、PDE1B、LZTS1和PCSK5四个关键预后基因,并构建了具有高预测准确性的预后模型和列线图。这些基因不仅与患者生存显著相关,还深入参与了结直肠癌的免疫微环境调节、特定信号通路活化以及化疗药物敏感性差异等关键生物学过程。功能实验进一步证实了PCSK5在促进结直肠癌细胞增殖、迁移和侵袭中的重要作用。该研究填补了棕色脂肪组织代谢与结直肠癌进展机制联系的知识空白,为结直肠癌的预后预测、风险分层以及个体化治疗策略的制定提供了新的生物标志物和潜在的干预靶点。尽管本研究存在回顾性分析的局限性以及需要进一步的前瞻性验证和机制探索,但其整合多维度数据的研究策略和所发现的创新性基因为结直肠癌的精准医疗开辟了新的方向,具有重要的理论意义和潜在的临床转化价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号