编辑推荐:
为解决消化道肿瘤(DTC)数据特征复杂、高维导致聚类时亚型重叠模糊的问题,研究人员开展了 DTC 亚型分析研究。他们提出 GDEC 模型,实验表明该模型性能卓越,还识别出 21 个关键基因及潜在治疗药物,为 DTC 精准治疗奠定基础。
在医学研究领域,癌症一直是高悬在人类健康头顶的 “达摩克利斯之剑”,而消化道肿瘤(Digestive Tract Cancer,DTC)更是其中的 “狠角色”。全球癌症报告显示,2022 年 DTC 占新增癌症病例的 25.8%,死亡病例的 35.4%。由于肿瘤内部存在多种基因组改变,DTC 具有高度的异质性,这使得治疗变得极为棘手,就像在迷雾中寻找正确的方向,困难重重。传统的癌症亚型分类方法,如 k - 均值聚类和层次聚类,在处理高维的癌症数据时,往往力不从心,无法准确地识别出不同的癌症亚型。而近年来兴起的深度学习方法,虽然在一定程度上有所改善,但仍存在诸如表示学习模块和聚类模块分离导致聚类效果不佳,以及依赖标记样本等问题。因此,如何精准地对 DTC 进行亚型分类,找到与肿瘤异质性和预后相关的关键基因,筛选出潜在的治疗药物,成为了医学研究人员亟待攻克的难题。
为了解开这些谜团,佛山大学数学学院、中山大学孙逸仙纪念医院口腔科等机构的研究人员携手开展了一项深入的研究。他们提出了一种名为 GDEC(Graph-based Deep Generative Neural Network for Digestive Tract Cancer Subtyping)的端到端图基生成深度神经网络,专门用于消化道肿瘤的亚型聚类分析。这项研究成果发表在《BioData Mining》杂志上,为消化道肿瘤的研究和治疗带来了新的曙光。
研究人员在开展此项研究时,运用了多种关键技术方法。他们从 TCGA 数据库获取了 6 个数据集(COAD
结肠、ESCA
食管、LIHC
肝脏、PAAD
胰腺、READ
直肠、STAD
胃) ,并从公共数据库收集了 10 个额外的癌症数据集。对这些数据进行预处理后,构建了 GDEC 深度学习框架。该框架包含图卷积网络(Graph Convolutional Network,GCN)层、生成对抗模块和聚类模块,通过整合这些模块优化模型。同时,利用随机森林(Random Forest,RF)等算法评估特征重要性,筛选生物标志物,并进行生存分析和药物筛选。
研究结果主要包括以下几个方面:
- GDEC 聚类性能评估:通过对不同癌症数据集进行分析,GDEC 将 COAD 和 LIHC 聚类为 5 个亚型,READ 和 STAD 聚类为 4 个亚型,ESCA 聚类为 2 个亚型,PAAD 聚类为 3 个亚型。从聚类结果来看,除 ESCA 外,不同癌症亚型间的 log-rank p 值均低于 0.01,表明该方法能成功识别出在统计学和生物学上有显著差异的癌症亚型,且在大多数癌症中展现出良好的可视化性能。与其他 6 种方法对比,GDEC 在?log<sub>10</sub>(p)指标上得分最高,平均达到 2.142,充分证明了其在癌症亚型分类上的卓越性能。
- 泛消化道肿瘤(pan-DTC)亚型的生存分析:运用 GDEC 对 pan-DTC 进行亚型分类,得到 4 个亚型。其中,S1 亚型患者预后最佳,其肿瘤微环境(Tumor Microenvironment,TME)中免疫细胞浸润水平较高,尤其是抗肿瘤免疫细胞。通过对转录因子和免疫功能等分析发现,S1 亚型具有独特的分子特征,在免疫检查点相关基因、MHC I 和 II 相关基因表达上较高,在特定免疫检查点抑制剂治疗下,S1 组患者的免疫表型评分(Immune Phenotype Score,IPS)显著升高。
- 枢纽基因验证:基于 pan-DTC 生物标志物识别结果,确定了 21 个与肿瘤异质性和预后相关的枢纽基因。这些基因在多种癌症组织中表达水平存在差异,其 mRNA 表达水平与拷贝数变异(Copy Number Variations,CNVs)在多数癌症类型中呈正相关,且甲基化水平与 mRNA 表达水平呈负相关。进一步研究发现,这些基因在激活上皮 - 间质转化(Epithelial-Mesenchymal Transition,EMT)通路的同时,抑制细胞周期通路,对患者预后有着重要影响。
- 潜在治疗药物筛选:根据枢纽基因,利用 GSEA 算法发现高风险患者中 EMT、血管生成和 TGF-β 等通路显著激活,且对免疫治疗反应不佳。通过 CTRP 和 PRISM 数据库筛选潜在治疗药物,以顺铂为基准验证方法可靠性后,最终确定 Dasatinib 和 YM155 对 pan-DTC 患者具有显著治疗潜力。
研究结论表明,GDEC 在消化道肿瘤亚型分类方面优于其他方法,能够聚类出具有生物学意义的肿瘤亚型,为选择潜在的癌症相关基因提供依据。基于聚类亚型确定的 21 个枢纽基因与 pan-DTC 的异质性和预后密切相关,并且与免疫治疗反应存在强关联。研究还发现 Dasatinib 和 YM155 等潜在治疗药物,为 pan-DTC 患者的精准治疗带来了新希望。
不过,研究也存在一些值得进一步探讨的地方。比如,整合多组学信息(如影像、表观基因组数据、临床数据等)和单细胞数据,可能会获得更全面的信息,提升模型聚类性能。此外,中性粒细胞在胃肠道恶性肿瘤异质性中的作用还需深入研究。未来研究若能在这些方面取得突破,有望进一步优化消化道肿瘤的治疗策略,为患者带来更好的治疗效果。总的来说,这项研究将先进的计算算法与生物学分析相结合,为 pan-DTC 患者的精准治疗奠定了坚实基础,在消化道肿瘤研究领域具有重要的里程碑意义。