编辑推荐:
肝细胞癌(HCC)预后差,治疗困难。为探索新疗法,研究人员整合单细胞 RNA 测序(scRNA-seq)、加权基因共表达网络分析(WGCNA)和机器学习,识别出 HCC 相关生物标志物,构建诊断模型。研究为 HCC 诊疗提供新方向。
肝细胞癌(Hepatocellular carcinoma,HCC)是全球癌症死亡的主要原因之一,尽管现有多种治疗手段,但患者总体预后仍差。寻找有效的生物标志物对预防 HCC 进展、改善治疗效果至关重要。然而,HCC 发生和发展的潜在分子机制尚未完全明确,这促使科研人员深入探索,以填补这一空白。
兰州大学的研究人员开展了一项综合研究,旨在识别参与 HCC 发生和发展的潜在生物标志物,并开发新的诊断模型,推动 HCC 的靶向治疗和免疫治疗发展。该研究成果发表在《Scientific Reports》上。
研究人员采用了多种关键技术方法。首先,从基因表达综合数据库(Gene Expression Omnibus,GEO)获取微阵列和单细胞 RNA 测序数据集,并进行预处理和整合。利用加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis,WGCNA)识别与 HCC 相关的基因模块;通过单细胞 RNA 测序分析,结合相关算法鉴定肿瘤细胞中的标记基因。运用支持向量机递归特征消除(Support Vector Machine Recursive Feature Elimination,SVM-RFE)、最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)、随机森林(Random Forest,RF)三种机器学习算法筛选候选诊断基因,构建并验证基于逻辑回归分析的列线图(nomogram)诊断模型。还利用分子对接技术探究药物与核心蛋白的相互作用。
在研究结果方面:
- 差异表达基因(Differentially Expressed Genes,DEGs)、基因本体(Gene Ontology,GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析:对 GSE214846 和 GSE77314 数据集分析,分别鉴定出 1407 个和 1929 个 DEGs。GO 和 KEGG 分析表明,上调基因与细胞周期、DNA 复制、p53 信号通路等相关,揭示了 HCC 发生发展的重要生物学过程。
- WGCNA 分析:对合并数据集进行 WGCNA,确定了与 HCC 显著相关的模块。其中,蓝色模块与 HCC 呈强正相关,包含 740 个显著特征基因,为后续研究提供了关键基因集。
- 单细胞 RNA 测序数据集分析:利用 “Seurat” 包对单细胞 RNA 测序数据集分析,鉴定出 24 个细胞簇,通过对恶性细胞簇的进一步分析,识别出 661 个标记基因,这些基因可能在 HCC 发生发展中起重要作用。
- 候选枢纽生物标志物的识别:通过 WGCNA、单细胞数据分析标记基因和上调 DEGs 的交集,得到 44 个重叠基因。三种机器学习算法进一步筛选出 CDKN3、PPIA、PRC1、GMNN 和 CENPW 作为枢纽生物标志物,ROC 曲线显示这些基因诊断效能高。
- 列线图的构建与验证:基于 GMNN 和 PRC1 构建列线图,校准曲线、ROC 分析和决策曲线分析(Decision curve analysis,DCA)表明该列线图具有良好的预测准确性和临床应用价值。
- 药物敏感性和分子对接分析:药物敏感性分析显示 GMNN/PRC1 表达与部分药物敏感性相关。分子对接结果表明,NPK76-II-72-1 与 GMNN 和 PRC1 蛋白结合能力良好,为潜在药物开发提供了线索。
- 表达谱和预后分析:分析 TCGA-LIHC 数据发现,CDKN3、PRC1、GMNN、CENPW 和 PPIA 在 HCC 样本中显著高表达。生存分析表明,这些基因高表达与患者不良预后相关,提示它们可作为预后预测生物标志物。
- 功能富集分析:对枢纽基因进行 GO 和 KEGG 富集分析,发现相关基因在 RNA 剪接、核糖体蛋白复合物生物发生、细胞周期、核质运输等过程和通路中显著富集,揭示了这些基因在 HCC 中的潜在功能机制。
研究结论表明,研究人员成功识别出与 HCC 发病机制密切相关的五个枢纽基因,通过逻辑回归分析进一步筛选出 GMNN 和 PRC1 构建列线图,该列线图在 HCC 临床决策中具有潜在应用价值。虽然 NPK76-II-72-1 作为靶向治疗药物的临床潜力还需进一步研究,但该研究为 HCC 的靶向治疗提供了新的思路和方向。
研究讨论指出,研究中上调基因与 p53 突变相关,在 HCC 发生发展中起重要调节作用;WGCNA 揭示了与 HCC 相关的基因模块和候选基因;单细胞数据分析有助于筛选 HCC 生物标志物;机器学习确定的核心基因可能在 HCC 发展中起关键作用。然而,研究存在一定局限性,如数据可能存在偏差和混杂因素,且依赖计算分析,未来需进一步深入研究这些基因的分子机制及其在靶向治疗和免疫治疗中的潜在意义。总的来说,该研究综合多种技术手段,为 HCC 的诊断和治疗提供了有价值的信息,对推动 HCC 领域的研究和临床实践具有重要意义。