编辑推荐:
乳腺癌(BRCA)预后预测困难,研究人员开展 “识别染色质重塑相关基因特征预测乳腺癌预后” 研究。通过分析多组数据,构建含 5 基因(LHX5、ZP2、GABRQ、APOA2、CLCNKB)的风险模型和列线图,为乳腺癌诊疗提供新方向。
在全球范围内,乳腺癌(Breast Cancer,BRCA)是女性中发病率极高的恶性肿瘤,如同隐藏在女性健康道路上的 “杀手”,严重威胁着女性的生命健康。它是一种异质性疾病,由多种致癌因素导致乳腺上皮细胞不受控制地增殖。尽管现代医学不断发展,手术切除、放化疗、内分泌治疗以及靶向分子治疗等手段都在应用,但目前对于乳腺癌预后的精准预测仍是一大难题。现有的基于患者年龄、淋巴结状态、肿瘤大小等临床因素的预后评估方式,无法充分反映患者个体的临床结局,即使具有相似临床特征的患者,预后情况也可能大相径庭。与此同时,随着分子技术的进步,基因表达谱分析虽在一定程度上提升了预后预测能力,但能确切用于乳腺癌预后判断的指标依旧难以确定。
在这样的背景下,山西省肿瘤医院的研究人员挺身而出,开展了一项意义重大的研究。他们试图寻找新的预后基因,为乳腺癌患者的治疗和预后评估开辟新的道路。研究成果发表在《Clinical and Experimental Medicine》上,给乳腺癌的研究领域带来了新的曙光。
研究人员在此次研究中运用了多种关键技术方法。他们从公共数据库(TCGA 数据库的 TCGA - BRCA 队列和 GEO 数据库的 GSE20685 数据集)获取临床和转录组数据,同时确定了 49 个染色质重塑相关基因(Chromatin Remodeling - Related Genes,CRRGs) 。之后,运用单变量 Cox 回归分析、共识聚类分析、差异表达分析等生物信息学分析方法,筛选出与预后相关的基因,构建风险模型和列线图,还进行了功能富集分析、免疫浸润分析和药物敏感性分析等,全面深入地探索这些基因在乳腺癌中的作用。
下面来看看具体的研究结果:
- CRRGs 相关亚型的识别:研究人员对 49 个 CRRGs 进行单变量 Cox 回归分析,筛选出 4 个与预后相关的 CRRGs(MTA1、INO80B、HDAC2 和 SMARCD3)。通过共识聚类分析,将 TCGA - BRCA 样本分为两个 CRRG 相关亚型(cluster 1 和 cluster 2)。PCA 分析显示这两个亚型明显分开,K - M 生存分析表明两个亚型的生存情况差异显著,cluster 1 的预后更好,且这 4 个预后相关 CRRGs 在两个亚型中的表达也存在显著差异。
- 候选基因的识别:对两个亚型进行差异表达分析,共鉴定出 250 个差异表达基因(Differentially Expressed Genes,DEGs)(cluster 1 vs. cluster 2);同时,在 TCGA - BRCA 队列中比较乳腺癌样本与对照样本,鉴定出 3145 个 DEGs(BRCA vs. control)。通过交集分析,得到 141 个候选基因。GO 和 KEGG 富集分析发现,这些候选基因显著富集在 “内分泌过程调节”“神经活性配体 - 受体相互作用” 等多个生物学过程和信号通路中。
- 风险模型的构建与验证:基于候选基因,通过单变量 Cox 和 LASSO 分析,确定了 5 个预后基因(LHX5、ZP2、GABRQ、APOA2 和 CLCNKB),其中 LHX5、ZP2、GABRQ 和 APOA2 是风险因素,CLCNKB 是保护因素,并构建了风险模型。在 TCGA - BRCA 训练集中,高风险组中 APOA2、LHX5、ZP2 和 GABRQ 的表达较高,而 CLCNKB 表达较低;K - M 生存分析显示高风险组预后较差。该模型在 TCGA - BRCA 测试集和 GSE20685 数据集中得到验证,具有良好的泛化能力。
- 列线图模型的开发:通过单变量和多变量 Cox 回归分析,将风险评分和 10 个临床特征纳入分析,确定了风险评分、年龄和肿瘤分期为独立预后因素,并开发了列线图模型。校准曲线和 ROC 曲线表明,该列线图模型具有较高的预测准确性和可靠性。
- 功能探索:通过基因集变异分析(Gene Set Variation Analysis,GSVA)发现,高风险组中 “mTORC1 信号通路”“E2F 靶点” 等 16 条信号通路显著激活,低风险组中 “雌激素早期反应”“肌生成” 等 9 条信号通路显著激活。基因集富集分析(Gene Set Enrichment Analysis,GSEA)也鉴定出多个与两组相关的 KEGG 通路。单基因 GSEA 分析为阐释预后基因在疾病进展中的分子机制提供了线索。
- 风险评分与临床特征及基因组变异的相关性分析:风险评分与乳腺癌的临床特征存在相关性,在病理 T 和 N 分期中差异显著。基因组变异分析显示,高风险组中 TP53 突变频率更高,且风险评分与肿瘤突变负荷(Tumor Mutation Burden,TMB)呈正相关,高风险组的 TMB 评分更高。
- 免疫微环境研究:分析 22 种免疫细胞类型在乳腺癌样本中的丰度发现,高、低风险组之间存在显著差异,如 CD8+ T 细胞、活化记忆 CD4+ T 细胞等。风险评分与 8 种差异免疫细胞类型显著相关,且两组的免疫检查点表达也存在差异。ESTIMATE 分析表明,低风险组的免疫评分显著较低,进一步证实了风险评分与免疫浸润的关系。
- 免疫治疗和药物敏感性分析:TIDE 分析显示,高风险组的 T 细胞功能障碍和 T 细胞排斥评分较低,可能对免疫治疗有更好的反应。药物敏感性分析表明,高风险组对 143 种化疗药物更敏感,如 AZD1332 1463 和 SB505124 1194;低风险组对 3 种药物更敏感,且风险评分与 6 种药物的 IC50值显著相关。
- 预后基因的表达分析:泛癌分析显示,5 个预后基因在多种癌症中存在显著表达差异。在 TCGA - BRCA 队列中,APOA2 和 GABRQ 在乳腺癌样本中显著上调,CLCNKB 和 ZP2 显著下调,qRT - PCR 验证了这一结果,LHX5 表达差异不显著。
综合上述研究结果,研究人员成功识别出 5 个与乳腺癌染色质重塑相关的预后基因,并构建了风险模型和列线图。这不仅为乳腺癌的预后评估提供了新的工具,还揭示了这些基因在免疫微环境和信号通路调节中的作用,为乳腺癌的临床诊断和治疗策略提供了新的思路。不过,该研究也存在一定的局限性,如样本来源和临床背景可能导致偏差,部分数据缺失影响分析准确性等。未来的研究需要扩大样本量,涵盖更多种族和地区的样本,进一步优化实验方法,深入探究这些基因的调控机制和功能,构建更精准可靠的预后模型,从而推动乳腺癌诊疗技术的不断进步,为更多患者带来希望。