揭秘肝细胞癌:13 个关键基因开启精准诊疗新征程

【字体: 时间:2025年05月11日 来源:BMC Cancer 3.4

编辑推荐:

  肝细胞癌(HCC)诊疗面临诸多困境,其肿瘤微环境(TME)异质性不明影响治疗与预后。研究人员运用无监督机器学习等技术开展相关研究,发现 13 个关键基因,或可助力找到可靠生物标志物和治疗靶点,为 HCC 诊疗带来新希望。

  在癌症的 “舞台” 上,肝细胞癌(Hepatocellular Carcinoma,HCC)可谓是一个 “狠角色”。它是最常见的肝癌类型,在全球范围内,是导致癌症相关死亡的主要原因之一。由于其早期症状隐匿,很多患者在确诊时已处于晚期,这使得手术切除、肝移植等根治性治疗手段的效果大打折扣,患者往往只能依赖非根治性的治疗方法,生存状况堪忧。
HCC 的肿瘤微环境(Tumor Microenvironment,TME)就像一个神秘的 “幕后推手”,对肿瘤的发展、治疗反应和预后都有着至关重要的影响。然而,这个微环境的异质性却如同迷雾一般,让人难以捉摸。传统的巴塞罗那临床肝癌(Barcelona Clinic Liver Cancer,BCLC)系统虽然应用广泛,但它主要基于肝脏功能分级、肿瘤大小和甲胎蛋白(α -fetoprotein,AFP)水平等物理属性对肝癌进行分类,却忽略了 TME 这个关键因素,导致无法准确预测治疗效果和患者的预后情况。

为了揭开 HCC 的神秘面纱,来自英国伯明翰大学(University of Birmingham)的研究人员 Mae Montserrat Reierson 和 Animesh Acharjee 勇挑重担,开展了一项极具意义的研究。他们的研究成果发表在《BMC Cancer》上,为我们理解 HCC 的发病机制和寻找新的治疗靶点带来了新的曙光。

研究人员采用了多种关键技术方法。在数据处理方面,从多个数据库筛选出合适的 HCC 基因表达数据集,如 GSE63898 作为主要数据集、GSE14520 用于验证。利用主成分分析(Principal Component Analysis,PCA)和 t - 分布随机邻域嵌入(t -distributed Stochastic Neighbor Embedding,t -SNE)进行异常值检测;借助 Boruta 算法进行特征选择,找出关键基因。在分析方法上,运用了三种无监督机器学习聚类方法:层次聚类(Hierarchical Clustering)、多组学因子分析(Multi - Omics Factor Analysis,MOFA)结合 K - means++、自动编码器(Autoencoder)结合 K - means++,对患者进行亚型分层。最后,使用免疫反卷积算法(如 CIBERSORT、TIMER、EPIC)来评估不同亚型中浸润免疫细胞的比例。

研究结果令人瞩目:

  1. 异常值与特征选择:通过 PCA 和 t -SNE 分析,在主要数据集和验证数据集中分别识别并去除了一些异常样本。经过一系列筛选和分析,从主要数据集的 49387 个基因探针中,最终确定了 46 个对区分肿瘤和非肿瘤样本重要的基因,这些基因就像是打开 HCC 奥秘之门的 “钥匙”。
  2. 聚类分析确定患者亚群:三种无监督聚类方法均显示 HCC 患者存在四个不同的亚群,这表明 HCC 在分子层面具有明显的异质性。例如,层次聚类发现第 4 亚群患者的平均年龄显著低于其他亚群;MOFA 结合 K - means++ 分析表明,数据方差主要由 6 个潜在因子解释,其中 DCN 基因对第 1 因子影响较大;自动编码器结合 K - means++ 确定的第 3 亚群患者平均年龄也较低。
  3. 重叠分析揭示保守亚群:通过重叠分析,发现了四个在三种聚类方法中都保持一致的患者亚群,进一步证实了这些亚群的生物学相关性。不同亚群具有独特的基因表达特征和生物学功能,如 H1M4A2 亚群中某些基因与巨噬细胞或单核细胞活性相关;H2M3A2 亚群中 CYP1A2 和 CYP3A4 等基因的上调与解毒途径或耐药机制有关。
  4. 免疫反卷积显示亚群差异:免疫反卷积结果显示,不同患者亚群的免疫细胞浸润模式存在差异。CIBERSORT 分析发现 13 种免疫细胞在不同亚群中的丰度有显著差异,如嗜酸性粒细胞、中性粒细胞和巨噬细胞等;而 TIMER 和 EPIC 的结果则相对较少显示出显著差异,这可能与样本的基因表达变异性以及算法本身的特点有关。
  5. 外部验证支持亚群稳健性:在验证数据集上进行相同分析后发现,虽然聚类结果与主要数据集不完全一致,但仍然支持了分子亚群与临床结果的相关性。例如,生存分析表明不同亚群患者的生存和复发情况存在显著差异,TOP2A、DCN 和 MT1E 等基因与生存和复发显著相关。

在讨论部分,研究人员指出,尽管此次研究取得了重要进展,但仍存在一些局限性。比如,免疫反卷积算法在处理小样本和样本方差较大的情况时存在不足;验证结果与主要数据集不完全一致,这可能是由于地域差异、患者个体差异以及其他未考虑到的因素导致的。然而,这也恰恰表明了 HCC 的复杂性,提示我们在未来的研究中需要考虑更多的因素。

总的来说,这项研究意义重大。发现的 13 个在不同数据集上都具有影响力的基因,为理解 HCC 的遗传机制和异质性提供了重要线索,有望成为更可靠的生物标志物和治疗靶点。同时,研究结果也强调了 TME 在 HCC 中的重要作用,为进一步探索 HCC 的发病机制和开发更有效的治疗策略奠定了基础。未来,研究人员可以通过整合更多的多组学数据,如免疫组化和肿瘤微生物组数据,运用无监督机器学习深入挖掘隐藏的特征关系,结合肿瘤克隆进化和更广泛的转录组分析,为 HCC 患者带来更精准的诊疗方案,让更多患者受益。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号