编辑推荐:
癌症驱动基因突变相关研究面临难题,哈尔滨医科大学研究人员开展 ProgModule 计算框架研究。结果显示该框架能有效识别突变驱动模块预测癌症预后和免疫治疗反应,相关基因可作潜在治疗靶点,为精准肿瘤学提供新思路。
在癌症研究的领域中,肿瘤的发生发展就像一场复杂的 “暗箱操作”,而驱动基因突变则是这场 “操作” 中的关键 “黑手”。癌细胞凭借着驱动基因突变,突破了正常细胞生长的规则限制,肆意增殖。随着癌症基因组学数据如潮水般涌现,如何精准区分癌症驱动突变和 “搭便车” 的乘客突变,成为了肿瘤学研究的核心难题。这就好比在茫茫大海中精准定位宝藏,只有找到了这些驱动突变,才能深入了解肿瘤发生的分子机制,进而为患者量身定制个性化的治疗方案。
此前,虽然科研人员们开发了不少算法来寻找这些突变 “宝藏”,比如 HotNet2、Mutex 等算法,试图从不同角度挖掘突变的秘密,但这些方法都存在着各种各样的问题。有的算法计算过程极为复杂,如同在迷宫中寻找出口,耗费大量的时间和精力;有的算法假阳性率高,容易 “误报军情”,给出错误的结果;还有的算法在临床应用上受到很大限制,无法真正帮助到患者。更重要的是,这些方法大多只关注突变的频率、覆盖范围和互斥性等表面特征,却忽略了突变组合在癌症预后中所起的关键作用。这就像是只看到了冰山一角,而没有深入探索冰山下面隐藏的巨大奥秘。
为了打破这一困境,哈尔滨医科大学的研究人员挺身而出,展开了一项极具意义的研究。他们致力于开发一种全新的计算框架,期望能够精准地识别出突变驱动模块,从而更准确地预测癌症患者的预后情况,以及评估免疫治疗的效果。经过不懈努力,他们成功开发出了 ProgModule 这一先进的计算框架,并将相关研究成果发表在了《Journal of Translational Medicine》杂志上。
研究人员在开展研究时,运用了多种关键技术方法。他们从癌症基因组图谱计划(TCGA)和国际癌症基因组联盟(ICGC)数据库收集了大量的体细胞突变数据和临床信息,为后续研究提供了坚实的数据基础。接着,从网络癌症基因与健康驱动基因(NCG)数据库获取驱动基因信息,并整合了来自 HotNet2 的三个蛋白质 - 蛋白质相互作用(PPI)网络。在分析过程中,通过提取非沉默突变,利用广度优先搜索(BFS)算法寻找局部子网,引入 PRMEM(Prognosis - Related Mutually Exclusive Mutation)评分来平衡突变的覆盖范围和组合机制对癌症预后的影响,运用贪心算法识别候选驱动模块,还进行了置换分析来确定模块的统计学意义。
研究结果
- ProgModule 在 BLCA 队列中的应用:研究人员将 ProgModule 应用于 TCGA - BLCA 队列,成功发现了 19 个具有统计学意义的突变驱动模块,这些模块包含 138 个基因,其中 49 个是癌症驱动基因。这些模块大小不一,功能各异,最小的模块 M2 包含 4 个基因,与致癌相关的 Wnt 和 Hippo 信号通路密切相关;最大的模块 M5 包含 16 个基因,在癌症发生发展的关键通路中高度富集。进一步研究发现,这些模块中的基因具有较高的覆盖度和互斥性,并且 17 个模块与患者的总生存期(OS)显著相关。在 ICGC - BLCA 队列中验证时,也有 14 个模块能预测患者的生存情况。同时,驱动模块在预测患者生存方面,总体上比单个基因表现更优。研究人员还构建了风险评分模型,该模型在 TCGA - BLCA 和 ICGC - BLCA 队列中都展现出了良好的预后预测价值123。
- ProgModule 在 HNSC 队列中的应用:在 TCGA - HNSC 队列中,ProgModule 同样表现出色,识别出了 18 个驱动模块,这些模块在关键生物学通路中显著富集,模块内突变基因具有互斥性和高覆盖度。14 个模块与 HNSC 患者的总生存期显著相关,在 ICGC - HNSC 队列中也有 11 个模块与患者生存相关。驱动模块的预后价值优于单个基因,基于这些模块构建的风险评分模型在两个队列中都能有效预测患者的预后456。
- 不同癌症类型间分子调控机制的比较:研究人员将 ProgModule 扩展应用到 22 种其他癌症类型,发现虽然在部分癌症类型中因突变发生率低未检测到驱动模块,但总体上 ProgModule 能成功识别出具有显著预后价值的驱动模块。而且,特定癌症类型中识别出的模块在多种癌症类型中都能用于预测预后。进一步研究发现,驱动模块在不同癌症类型中大多具有特异性,但通过基因本体(GO)和 KEGG 功能富集分析发现,不同癌症类型之间存在共享的调控机制789。
- ProgModule 的稳健性分析:为了评估 ProgModule 的稳健性,研究人员对模型参数进行了探索。结果发现,改变停止标准(如改进率 r)和网络拓扑结构(去除部分 PPI 网络边)对识别的模块影响较小,表明 ProgModule 对这些模型参数具有较强的稳健性1011。
- ProgModule 对癌症免疫治疗反应的预测:研究人员将 ProgModule 应用于 Van Allen 队列(包含 105 名黑色素瘤患者),识别出 5 个与免疫治疗反应相关的驱动模块。这些模块参与重要生物学过程,与患者生存显著相关,且根据模块构建的风险评分模型能有效预测患者的总生存期和免疫治疗的客观缓解率(ORR)。在另一个独立的免疫治疗队列(Miao 队列)中也得到了验证,并且该风险评分模型在预测免疫治疗效果方面优于其他已发表的免疫治疗生物标志物。此外,通过对已发表的 CRISPR 筛选数据的分析,研究人员还发现了驱动模块中的 4 个基因与抗肿瘤免疫显著相关,这些基因有望成为潜在的治疗靶点121314。
研究结论与讨论
研究人员成功开发的 ProgModule 计算框架,在识别癌症驱动模块方面展现出了卓越的性能。与现有方法相比,它能更准确地预测 24 种癌症类型患者的生存情况,在免疫治疗队列中也表现出色,能更有效地预测免疫治疗的效果。基于 CRISPR 数据的分析还揭示了模块内基因作为潜在治疗靶点的可能性,为精准肿瘤学的发展提供了新的方向。
然而,ProgModule 也并非十全十美。在一些癌症类型中,由于突变发生率较低,无法检测到驱动模块,这提示研究人员在未来还需要进一步优化该方法,提高其在不同癌症类型中的检测灵敏度。但无论如何,这项研究成果为癌症研究领域带来了新的曙光,为癌症的诊断、治疗和预后评估提供了有力的工具和理论依据,有望推动精准肿瘤学朝着更加精准、高效的方向发展。