基于机器学习算法构建以瘤内肿瘤浸润淋巴细胞为核心的乳腺癌患者预后模型

【字体: 时间:2025年05月15日 来源:Discover Oncology 2.8

编辑推荐:

  乳腺癌是严峻的全球健康挑战,肿瘤浸润淋巴细胞(TILs)与病情密切相关。研究聚焦瘤内 TILs(iTILs),利用多数据库数据,通过机器学习整合 101 种算法构建预后模型,其预测效能显著,为精准诊疗提供新工具。

  
乳腺癌作为威胁女性健康的 “头号杀手”,其高发病率与死亡率始终是全球医疗领域的重大挑战。肿瘤浸润淋巴细胞(Tumor-Infiltrating Lymphocytes, TILs)作为评估免疫应答的关键生物标志物,虽已有较多关于基质 TILs(sTILs)的研究,但直接接触肿瘤细胞的瘤内 TILs(iTILs)在免疫 - 肿瘤相互作用中的潜在价值尚未被充分挖掘。传统检测手段受限于 iTILs 丰度低、异质性高及 H&E 染色的局限性,难以精准量化其水平,导致对乳腺癌患者的预后分层和个性化治疗策略制定存在瓶颈。

为突破这一困境,同济大学医学院附属同济医院与同济大学癌症中心的研究团队开展了一项创新性研究。团队基于 iTILs 在肿瘤免疫中的核心作用,构建了首个以 iTILs 为中心的乳腺癌预后模型,并深入解析其免疫微环境特征及潜在治疗方案。该研究成果发表在《Discover Oncology》,为乳腺癌的精准医疗提供了重要科学依据。

研究人员整合多维度数据,从癌症基因组图谱(TCGA)和乳腺癌国际分子分类联盟(METABRIC)获取 3046 例乳腺癌患者的 RNA-seq 数据及临床资料作为训练集,并从基因表达综合数据库(GEO)纳入 GSE20685、GSE42568 等多个独立验证集。通过共识聚类(Consensus Clustering)和加权基因共表达网络分析(Weighted Correlation Network Analysis, WGCNA)筛选出 iTILs 相关枢纽基因,进而利用包含 101 种算法组合的机器学习框架(如 Lasso、随机生存森林 RSF 等)构建预后模型。研究采用 Kaplan-Meier 分析、列线图(Nomogram)模型及 ROC 曲线评估模型效能,并结合 CTRP v2.0 和 PRISM 数据库挖掘高风险患者的潜在治疗药物。

3.1 免疫浸润共识聚类的建立与验证


研究通过 8 种反卷积算法(如 xCell、CONSENSUS_TME)量化 iTILs 水平,发现 CONSENSUS_TME 算法与淋巴细胞标记基因(PDCD1、CD8A 等)的相关性最强,遂以此定义 iTILs 评分。基于该评分将样本分为两个免疫聚类,其中 Cluster2 的 iTILs 浸润水平显著更高,且在 PAM50 亚型中表现出更强的免疫评分和细胞溶解活性(CYT)评分,提示其免疫应答更为活跃。

3.2 机器学习驱动的预后模型构建


通过 WGCNA 识别出与 iTILs 高度相关的 “红色模块”,从中筛选出 285 个枢纽基因。经单变量 Cox 回归分析和 101 种机器学习算法组合优化,最终确定 CoxBoost+RSF 模型为最优预测模型(ITILS 模型),其核心由 19 个 iTILs 相关基因组成。该模型在训练集和多个验证集中均表现出优异的预测效能,3 年、5 年、10 年生存预测的 AUC 值分别达 0.940、0.959、0.973,显著优于 38 种已发表的预后模型。

3.3 临床相关性与列线图模型构建


单因素和多因素 Cox 回归分析表明,ITILS 评分是独立于 TNM 分期、治疗方式等的预后风险因素(HR>1,p<0.0001)。整合 ITILS 评分与 T 分期构建的列线图模型,其 3 年、5 年、10 年生存预测的 AUC 值分别为 0.947、0.953、0.966,校准曲线显示预测与实际生存高度一致,决策曲线分析证实其临床净获益显著优于单一临床指标。

3.4 免疫微环境与免疫基因组特征


高风险组患者的免疫微环境呈现显著差异,GO 和 KEGG 分析显示差异基因富集于免疫球蛋白生成、细胞因子 - 细胞因子受体相互作用等通路。免疫细胞浸润分析表明,在 Her2、LumB 等亚型中,低风险组的 B 细胞、CD8+ T 细胞等免疫细胞丰度更高,且与三级淋巴结构(TLS)相关基因呈负相关,提示高风险组可能存在免疫抑制微环境。免疫基因组分析显示,高风险组 TP53 突变率显著升高,且在 LumB 亚型中肿瘤内异质性(ITH)、同源重组缺陷(HRD)等指标更高,与免疫逃避机制密切相关。

3.5 高风险患者潜在治疗药物筛选


通过整合 GDSC、CTRP v2.0 和 PRISM 数据库,筛选出 11 种对高风险患者潜在敏感的药物。结合文献挖掘和 CMap 分析,确定 mTOR 抑制剂替西罗莫司(Temsirolimus)和依维莫司(Everolimus)为最优候选药物,其 CMap 评分

结论与意义


本研究首次构建了基于 iTILs 的乳腺癌机器学习预后模型,揭示了 iTILs 在肿瘤免疫中的核心作用及与临床预后的强相关性。模型不仅为患者提供了精准的风险分层工具,还通过免疫微环境和基因组特征分析,为个性化治疗策略(如 mTOR 抑制剂的应用)提供了理论依据。尽管研究基于回顾性数据,需前瞻性验证,但已为乳腺癌的预后预测和免疫治疗研究开辟了新方向,有望推动 “精准免疫肿瘤学” 的临床实践。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号