基于单细胞测序的NK细胞标志基因鉴定构建乳腺癌预后新模型

《Hormones & Cancer》:Identification of NK cell marker genes based on single-cell sequencing to establish a prognostic signature in breast cancer

【字体: 时间:2025年12月20日 来源:Hormones & Cancer

编辑推荐:

  本研究针对乳腺癌肿瘤微环境中自然杀伤(NK)细胞作用机制不清的问题,通过单细胞测序技术鉴定NK细胞标志基因,利用机器学习算法构建预后风险模型。研究发现TCF7、CCND3等5个关键基因组成的特征能有效预测患者生存,高风险组免疫细胞浸润特征显著差异。该模型为乳腺癌免疫治疗提供新靶点,对个体化治疗策略制定具有重要临床意义。

  
乳腺癌作为全球女性最常见的恶性肿瘤,每年导致约68.5万人死亡,其预后受到年龄、肿瘤分期、治疗方案响应等多种因素影响。尽管综合序列治疗取得了显著进展,但乳腺癌的高异质性及复发转移风险仍是临床面临的重大挑战。肿瘤微环境(TME)在癌症进展和治疗响应中起着关键作用,其中自然杀伤(NK)细胞作为先天免疫的重要组分,具有识别和清除肿瘤细胞的能力,其浸润水平与患者预后呈正相关。然而,NK细胞在乳腺癌中的具体作用机制及其临床意义尚未完全阐明。
为深入探究NK细胞在乳腺癌预后评估中的价值,研究团队创新性地整合单细胞测序与机器学习技术,开展了系统性研究。该研究成果发表于《Discover Oncology》,为乳腺癌免疫治疗提供了新的生物标志物和治疗靶点。
研究主要采用四大关键技术方法:首先从GEO数据库获取乳腺癌单细胞转录组数据(GSE235168,n=25),通过Seurat包进行质控和细胞聚类,利用SingleR包和经典标记基因双策略鉴定NK细胞;其次基于TCGA数据库的1104例乳腺癌样本RNA-seq数据,筛选与总体生存(OS)相关的NK标志基因;接着运用十种机器学习算法(包括RSF、Lasso、GBM等)构建预后模型,通过C-index和AUC值优选随机生存森林(RSF)算法;最后利用GSE20685(n=327)和METABRIC(n=2000)数据集进行外部验证,并通过ssGSEA、GSVA等方法分析免疫浸润特征和功能通路。
Identification of NK cell marker genes
通过单细胞测序数据分析,研究团队从5例乳腺癌患者样本中鉴定出21,419个基因,经质量控制后筛选出2,000个高变基因进行主成分分析(PCA)。细胞聚类分析识别出11个细胞亚群,其中簇3被注释为NK细胞。最终确定29个NK细胞相关标志基因,功能富集分析显示这些基因主要富集于Wnt和JAK-STAT信号通路。细胞通讯分析表明NK细胞与T细胞、B细胞等多种免疫细胞存在相互作用网络。
Establishment of an NK related prognostic model for breast cancer
在TCGA-BRCA数据集中,27个NK标志基因中有5个(TCF7、CCND3、BTG1、ZFP36L2和RPSA)与预后显著相关。通过十种机器学习算法比较,随机生存森林(RSF)模型表现最优(AUC=0.8,C-index=0.8)。该模型与TNM分期具有显著关联,T3/T4期患者风险评分更高。在TCGA数据集中,模型对5年生存率的预测AUC达0.98;在GEO和METABRIC数据集中也显示出良好预测效能(5年AUC=0.82)。
Nomogram of the prognostic risk model
单多因素Cox回归分析证实风险评分和年龄是独立预后因素。整合临床参数构建的列线图模型,其1、3、5年生存预测AUC分别为0.834、0.954和0.981。决策曲线分析(DCA)显示模型具有良好临床适用性。外部验证进一步证实了模型的稳健性。
Characteristics of NK cell marker genes in the prognostic risk model
5个关键基因在肿瘤与正常组织间表达差异显著,且在高/低风险组间呈现规律性表达模式。基因突变分析显示,高风险组TP53(33%)、PIK3CA(31%)等基因突变频率较高,而拷贝数变异(CNV)分析揭示两组间基因组不稳定性存在差异。
Evaluation of tumor-infiltrating immune cells utilizing the risk stratification
ssGSEA分析显示高风险组T细胞亚群分布异常,基质评分、免疫评分和ESTIMATE评分升高,肿瘤纯度降低。50个免疫检查点分子(如CD47、TIGIT等)表达存在显著组间差异。GSVA功能分析提示高风险组富集于白细胞介素1受体活性、精子射精等通路。
Tumor mutation landscape and drug responses in the risk model
突变谱分析显示低风险组肿瘤突变负荷(TMB)略高(p=0.0712)。结合风险评分与TMB的分层分析显示生存差异显著(p<0.0001)。药物敏感性分析发现Tozasertib、Mirin等10种药物在高风险组表现出更高敏感性,为个体化治疗提供参考。
本研究通过单细胞测序技术成功构建了NK细胞相关的乳腺癌预后模型,揭示了NK细胞标志基因与肿瘤免疫微环境的密切联系。研究发现5个关键基因(TCF7、CCND3、BTG1、ZFP36L2、RPSA)组成的特征能有效区分患者预后,高风险组表现出独特的免疫抑制微环境特征。该模型不仅为乳腺癌预后评估提供了新工具,更重要的是揭示了NK细胞在乳腺癌发生发展中的调控网络,为免疫治疗靶点开发提供了理论依据。研究局限性包括样本量有限、回顾性数据偏差等,未来需要通过前瞻性研究验证模型的临床适用性,并深入探索关键基因的分子机制。这项研究为推动乳腺癌精准免疫治疗迈出了重要一步,为改善患者预后开辟了新的研究方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号