基于多癌种RNA测序的肿瘤基质硬度分子标志物预测模型及其对肿瘤微环境与免疫反应的调控机制研究

【字体: 时间:2025年09月26日 来源:International Journal of Cancer 4.7

编辑推荐:

  本研究通过整合10项独立研究的RNA测序数据,开发了首个基于转录组特征预测实体瘤基质硬度的计算模型StiffCalc。该模型利用8个核心基因标志物(如ADD3、CGB8等),在TCGA泛癌数据分析中揭示硬度与肿瘤微环境(TME)复杂性、免疫抑制及治疗抵抗的显著关联,为靶向肿瘤力学特性的创新治疗策略提供了分子基础。

  
Abstract
肿瘤基质硬度在癌症进展、转移和治疗抵抗中起关键作用。本研究利用RNA测序数据预测肿瘤基质硬度,旨在通过分子特征揭示多种癌症类型的力学特性。通过系统分析不同硬度水平的肿瘤RNA测序数据,鉴定出硬度相关基因特征,并构建计算模型预测TCGA数据集中的肿瘤基质硬度。分析显示软硬肿瘤样本在肿瘤微环境和免疫反应方面存在显著差异,表明肿瘤硬度不仅影响细胞行为,还调控微环境特性。这些发现强调了基于RNA的硬度模型在增强对肿瘤力学和癌症生物学理解方面的潜力。
What's New?
本研究首次利用肿瘤RNA测序数据鉴定多种癌症类型的力学特性分子标志物,并构建预测肿瘤基质硬度的计算模型。应用该模型于TCGA数据集发现,肿瘤硬度不仅影响细胞行为,还显著改变肿瘤微环境特性,突出了RNA基础硬度模型在理解肿瘤力学和促进靶向治疗开发中的价值。
1 INTRODUCTION
肿瘤基质硬度主要指细胞外基质(ECM)的机械刚性,受胶原交联和细胞收缩性等因素影响。硬度升高与肿瘤发生、进展、转移及治疗抵抗相关。研究硬度不仅深化了对肿瘤生物学的理解,还为靶向肿瘤力学特性的治疗干预开辟了新途径。传统生物物理技术如原子力显微镜和工程化水凝胶已用于模拟ECM力学特性,但这些方法仅限于测量肿瘤的物理性质。例如,显微镜技术结合蛋白质共轭水凝胶基底显示,ECM硬度与高转移性黑色素瘤细胞的生长和迁移速度相关。此外,硬度通过激活癌症和基质细胞中的特定转录因子调控肝细胞癌进展。
RNA测序等新一代测序技术逐渐应用于研究硬度对分子通路的影响。例如,RNA测序揭示了卵巢癌中PLEC和TNS2等新型硬度响应标志物,为转移机制提供新见解。在乳腺癌中,ECM硬度升高诱导恶性表型,mRNA表达变化模拟了从导管原位癌向浸润性导管癌的转变,表明硬度促进癌症侵袭。这些发现支持了基于转录组数据构建硬度预测模型的可行性,但目前尚缺乏利用RNA测序数据系统预测基质硬度的研究。
本研究旨在利用RNA测序数据鉴定多种癌症类型的硬度相关基因标志物,并开发计算模型预测ECM硬度。应用该模型于TCGA数据,构建泛癌硬度图谱,分析软硬肿瘤在TME和免疫反应方面的差异,为靶向治疗提供新策略。
2 METHODS
2.1 RNA-seq data retrieval
收集10项独立研究的RNA测序数据集,这些研究在不同基质硬度条件下分析肿瘤细胞。所有数据集使用工程化Matrigel模拟不同力学环境,肿瘤细胞来源包括乳腺、卵巢、食管、肝脏、口咽和纤维结缔组织等。软培养条件硬度为100-1000 Pa,硬条件为1000-8000 Pa。数据从GEO数据库获取。
2.2 RNA-seq data analysis to identify marker genes for predicting matrix stiffness
使用SRA-Toolkit从GEO获取RNA测序数据,原始读数通过STAR比对到人类参考基因组GRch38.d1.vd1。基因表达谱通过GENCODE v35.0确定,采用DESeq2进行差异表达分析,筛选调整p值<0.05和log2倍数变化>1的基因。在多数据集中共同鉴定的差异表达基因(DEGs)选为硬度标志物。
2.3 Computational model for predicting tumor matrix stiffness
开发基于逻辑回归的模型StiffCalc,使用鉴定出的基因标志物作为输入特征。基因表达水平通过TPM标准化,并进行z-score归一化以减少数据集间变异。使用R“glmnet”包训练模型,采用留一法交叉验证优化参数,通过ROC和PR曲线评估性能。特征重要性通过逻辑回归系数绝对值评估。
2.4 TCGA pan-cancer analysis
分析TCGA中24种癌症类型的RNA测序和突变数据,利用StiffCalc预测肿瘤硬度,比较软硬组的分子特征。基质体基因从MatrisomeDB获取,包括糖蛋白、蛋白聚糖、胶原、分泌因子、ECM相关蛋白和ECM调节基因等六类。
2.5 Tumor microenvironment analysis
使用ESTIMATE和CIBERSORT分析TME。TPM标准化数据输入ESTIMATE计算基质和免疫评分,比较软硬组间差异。CIBERSORT反卷积估计22种细胞类型的相对丰度,通过t检验和log2倍数变化识别显著关联。
2.6 Gene set enrichment analysis
使用GSEA和R“clusterProfiler”包分析硬度相关通路。基于MSigDB、Reactome和GO数据库,比较软硬肿瘤的基因表达,筛选平均表达>5的基因,按log2倍数变化排序识别显著通路。免疫细胞富集分析聚焦17种免疫细胞标志基因,筛选绝对富集分数>0.5和调整p值<0.05的特征。
2.7 Tumor immune dysfunction and exclusion analysis
通过TIDE分析评估免疫检查点抑制剂反应。获取OncoDB的TPM数据,对数转换后与正常样本比较,计算log2倍数变化作为TIDE输入。预测免疫治疗反应,比较软硬组TIDE分数,使用t检验分析差异。
3 RESULTS
3.1 Identifying common gene markers associated with tumor matrix stiffness
整合10项研究的RNA测序数据,鉴定硬度相关通用基因标志物。软硬条件比较识别DEGs,发现多数据集共享基因如KRT7。共675个DEGs在至少三个数据集中出现,120个在四个以上数据集中常见。通路富集分析显示这些基因显著参与ECM组织、胶原形成和膜-ECM相互作用等过程,GO分析证实ECM成分、肿瘤腔和细胞膜成分的富集,表明ECM完整性和细胞-ECM相互作用贡献于肿瘤硬度。免疫和代谢通路 also 富集,提示硬度关联结构和免疫特性。
3.2 Developing a computational model for predicting tumor matrix stiffness
基于共享DEGs构建预测模型,使用逻辑回归分类软硬肿瘤。采用留一法交叉验证,基于五个数据集共享DEGs的模型性能最佳,ROC AUC为0.893,PR AUC为0.883。StiffCalc最终基于八个基因:ODC1、SDC1、LINC00842、CREB3L1、CGB8、PI3、ATOH8、ADD3。特征重要性显示ADD3关联最强,传统功能为膜骨架蛋白增强质膜。CGB8激活ECM通路促进迁移,CREB3L1通过ECM信号促进转移,LINC00842关联钙离子绑定改变代谢,ODC1通过AKT/GSK3β/β-catenin通路促进增殖,PI3抑制中性粒细胞弹性蛋白酶结合ECM蛋白。这些基因维持ECM硬度并驱动进展。额外四个独立数据集验证模型平均准确度0.94,显示跨癌种稳健性。
3.3 Variations in tumor complexity associated with matrix stiffness
应用StiffCalc于TCGA泛癌数据,分析硬度与肿瘤复杂性关系。通过ESTIMATE评估复杂度,硬肿瘤在21/24癌种中显示更高ESTIMATE分数,表明更复杂TME和更多非肿瘤细胞。硬肿瘤基质评分更高,提示基质细胞浸润增加和ECM密度升高,但免疫评分较低,表明免疫抑制微环境。多变量调整确认硬度独立关联肿瘤复杂性。最显著癌种包括BLCA、COAD、OV和READ,但LGG、GBM和THCA无差异,反映其独特生物学。CIBERSORT分析显示硬肿瘤中CAF和内皮细胞分数更高,表明这些细胞在建立和维持硬度中的关键作用,突出TME中机械特性与细胞组成的 interplay。
3.4 Pathway analysis of the functional effects of tumor matrix stiffness
MSigDB hallmark通路富集分析显示硬肿瘤显著富集顶连接和上皮间质转化(EMT)通路,表明硬度改变细胞粘附和迁移。代谢通路如缺氧和血管生成也富集,提示硬度影响血管动态和氧合。免疫相关通路如TNFα信号、干扰素通路和IL6-JAK-STAT3信号在硬肿瘤中活性降低,表明免疫响应减弱。Reactome通路分析显示适应性免疫通路如TCR信号、PD-L1免疫调节互作和细胞因子信号活性减少,提示硬度损害适应性免疫响应,可能促进免疫逃避。但B细胞激活和抗原呈递通路无显著变化。总体表明硬度 intricately 连接EMT、血管生成和免疫响应,促进迁移、 invasion 和新血管形成,同时调制免疫活动助长逃避。
3.5 Immune infiltration patterns in relation to tumor matrix stiffness
免疫细胞富集分析显示硬肿瘤中关键免疫细胞如T调节细胞(Tregs)、中性粒细胞、巨噬细胞、细胞毒性/CD8+ T细胞和B细胞富集分数降低。T细胞耗竭更明显,与TCR信号活性减少一致,支持硬度干扰适应性免疫响应。TIDE预测表明硬肿瘤更可能抵抗免疫治疗,突出硬度作为免疫治疗响应的生物标志物需求。相关分析显示硬肿瘤在11种癌种中与更晚期阶段显著相关,表明硬度促进进展。
3.6 Matrisome mutations associated with tumor matrix stiffness
比较所有基因突变与基质体特异性突变,发现基质体基因突变负担更高(3.08 vs. 4.35)。大多数基质体突变与硬度正相关,突变负担高的肿瘤硬度更大,在SKCM、ESCA和STAD中尤其显著。这些突变可能直接改变ECM物理特性。个体基因如胶原和基质金属蛋白酶(MMPs)突变在硬肿瘤中更频繁,可能导致异常胶原交联增加刚性。层粘连蛋白和serpin突变在STAD和SKCM中富集,改变细胞-ECM相互作用贡献机械抵抗。突出基质体突变在通过修改ECM结构和功能塑造硬度中的关键作用。
4 DISCUSSION
本研究开发了基于RNA测序数据预测肿瘤基质硬度的模型,传统方法如原子力显微镜成本高且技术复杂,本方法可扩展且易获取。预测硬度有助于整合机械特性与分子特征,增强对肿瘤行为理解。鉴定硬度相关基因标志物如CGB8,扩展了其生物学角色 beyond 妊娠,关联多癌种ECM通路激活。应用模型于TCGA显示硬肿瘤与更复杂和免疫抑制微环境相关,基质细胞浸润增加和免疫细胞减少,机制可能包括ECM物理屏障和信号通路激活免疫抑制。跨癌种一致性支持硬度作为免疫治疗预测生物标志物,与TMB互补。靶向ECM组分如抑制胶原交联可能减少硬度改善免疫浸润,结合免疫检查点抑制剂增强疗效。临床中硬度模型可用于患者分层、 aggressiveness 预测和个性化治疗指导,例如高硬度低免疫浸润肿瘤可能受益于ECM靶向剂联合免疫治疗。局限性包括模型仅基于实体瘤训练,可能不适用于软组织肿瘤或血液恶性肿瘤,未来需评估更广适用范围。
AUTHOR CONTRIBUTIONS
Gongyu Tang: 综述编辑、方法、软件、概念化、调查、原稿撰写、数据管理、形式分析、项目管理、监督、资源、验证、可视化。Xinyi Liu: 概念化、综述编辑、验证、方法、资源。Yuanxiang Li: 概念化、综述编辑、资源、数据管理、调查。Yunfei Ta: 方法、资源、综述编辑、调查。Minsu Cho: 调查、综述编辑、资源、数据管理。Hua Li: 概念化、资金获取、综述编辑、资源、监督、项目管理。Xiaowei Wang: 项目管理、资源、监督、数据管理、综述编辑、原稿撰写、资金获取、调查、概念化、方法。
FUNDING INFORMATION
本研究由美国国立卫生研究院支持(R01DE026471、R01CA233873、R56DE033344、R01CA287778和R35GM141535)。
CONFLICT OF INTEREST STATEMENT
作者声明无利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号