
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习整合的免疫相关基因特征预测乳腺癌预后及免疫微环境浸润
【字体: 大 中 小 】 时间:2025年06月06日 来源:Scientific Reports 3.8
编辑推荐:
乳腺癌复发风险预测是临床精准治疗的难点。为解决传统预后模型单一算法导致的过拟合问题,中国中医科学院广安门医院团队通过整合10种机器学习算法构建117个模型,筛选出由12个基因组成的免疫相关特征(IRGS)。该特征在多个数据集中展现卓越预测性能,能有效区分高低风险患者,揭示CD4+ /CD8+ T细胞与M2巨噬细胞浸润的免疫微环境差异,并为免疫治疗响应提供新标志物。研究为乳腺癌个体化治疗决策提供重要工具。
乳腺癌作为女性发病率最高的恶性肿瘤,尽管早期患者可通过手术和辅助治疗获得较好疗效,但约30%病例仍面临复发转移风险。传统AJCC/TNM分期和生化标志物在精准医疗时代已显不足,现有预测模型多依赖单一算法,存在过拟合或泛化性差等问题。更棘手的是,不同分子亚型(如ER-
与HER2+
)的复发模式存在显著差异,而免疫微环境在复发中的作用机制尚未阐明。这些挑战促使中国中医科学院广安门医院联合贵州中医药大学第一附属医院的研究团队开展这项创新研究。
研究人员从METABRIC、TCGA和GEO数据库获取3,620例乳腺癌患者数据,采用GSEA分析筛选复发相关通路,整合10种机器学习算法(包括StepCox[both]和Ridge回归)构建预测模型,并通过ESTIMATE算法和CIBERSORT评估免疫浸润特征。
复发相关通路分析
通过GSEA发现短期复发组(ST)显著富集于免疫调节通路,包括B细胞受体信号(hsa04662)和NK细胞介导的细胞毒性(hsa04650),而长期无复发组(LT)主要富集代谢相关通路。这一发现揭示了免疫逃逸可能是复发关键机制。
机器学习模型构建
从587个免疫相关基因中筛选出103个预后基因,经117种算法组合验证,最终确定由CHUK、BLNK等12个基因组成的IRGS特征。该模型在训练集(METABRIC)的5年AUC达0.877,显著优于既往10种预测标志物。
免疫微环境解析
低风险组表现出更强的免疫表型:CD8+
T细胞和M1巨噬细胞浸润增加,但M2巨噬细胞的高浸润提示潜在免疫逃逸风险。值得注意的是,PD-L1、CTLA4等免疫检查点在低风险组显著高表达,TIDE评分提示这类患者可能对ICI治疗更敏感。
治疗策略探索
药物敏感性分析发现:高风险组对克唑替尼(Crizotinib)敏感,而低风险组对吉西他滨(Gemcitabine)响应更佳,为分层治疗提供依据。
这项发表于《Scientific Reports》的研究首次通过多算法整合构建出高精度复发预测工具IRGS,其价值体现在三方面:技术上,突破单一算法局限,通过StepCox[both]动态筛选变量结合Ridge回归优化权重;临床上,将免疫微环境特征与预后预测结合,指导ICI治疗决策;转化医学上,发现的12个关键基因为后续机制研究提供新靶点。尽管存在回顾性数据的局限性,但研究为实现乳腺癌精准治疗迈出关键一步,未来可通过前瞻性试验进一步验证其临床适用性。
生物通微信公众号
知名企业招聘