深度学习助力解析致癌突变:改变蛋白质核质穿梭驱动肿瘤发生的关键

《Nature Communications》:

【字体: 时间:2025年03月15日 来源:Nature Communications

编辑推荐:

  在癌症研究中,基因突变影响蛋白质核定位的机制尚不明确。中山大学肿瘤防治中心的研究人员开展了 “深度学习优先识别改变蛋白质核质穿梭以驱动肿瘤发生的癌症突变” 的研究,构建 pSAM 模型,发现相关突变及关键基因,为理解肿瘤发生机制提供依据。

  在生命的微观世界里,蛋白质就像忙碌的 “小邮差”,在细胞的不同区域传递信息、执行任务,其中,蛋白质在细胞核与细胞质之间的穿梭活动至关重要。它不仅参与了细胞的正常生理过程,如基因表达调控、信号传导等,还与肿瘤的发生发展紧密相连。然而,目前科学界对基因突变如何影响蛋白质的核质穿梭,进而推动肿瘤进展的理解还十分有限。这就好比在一座复杂的城市中,虽然知道某些道路可能被破坏会影响交通,但具体是哪些道路、如何影响却不清楚。为了揭开这个谜团,中山大学肿瘤防治中心的研究人员展开了深入研究,相关成果发表在《Nature Communications》上。
研究人员为了系统地探究基因突变与蛋白质核质穿梭之间的关系,构建了一个基于深度学习的框架。其中,核心是名为 pSAM 的深度学习模型,它融合了卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)架构,并引入了注意力机制。这个模型就像一个 “智能探测器”,能够精准地预测蛋白质的潜在核定位,还能从蛋白质序列中挖掘出与核定位相关的关键信息。

在研究过程中,研究人员使用了多种技术方法。他们从多个数据库收集数据,包括从 The Cancer Genome Atlas(TCGA)获取 11 种癌症类型的突变数据,从 UniProt 数据库收集真核生物蛋白质序列和定位注释等。通过对这些数据的整理和分析,为后续研究奠定了基础。同时,利用深度学习技术构建并优化 pSAM 模型,通过一系列评估指标来验证模型的性能。此外,还进行了多种实验,如细胞实验、动物实验等,对模型预测结果进行验证。

研究结果如下:

  • 癌症突变对蛋白质核定位的影响:研究人员分析了 TCGA 中 11 种癌症类型的突变数据,发现突变在核定位信号(NLS)和核输出信号(NES)的靶向肽区域更为频繁,且这些区域的突变更具危害性。例如,在转录抑制因子 BACH2 的实验中,当突变位于其 NLS 区域时,其底物 TXNRD1 和 CLIP1 的表达显著上调,这表明突变可能影响蛋白质的核质穿梭,进而调节其生物学功能。
  • pSAM 模型的性能评估:通过构建 pSAM 模型并进行一系列评估,结果显示该模型在预测蛋白质核定位概率方面表现卓越。在十折交叉验证中,其受试者工作特征曲线下面积(AUC)值在 0.9726 - 0.9848 之间,在训练集、验证集和测试集中的 AUC 值分别达到 0.9932、0.9876 和 0.9865 。与其他预测工具相比,pSAM 模型的性能更优,能够准确地识别出蛋白质序列中与核定位相关的关键区域,即决定核定位的序列(DNLs)。而且,通过残差水平贡献分析(RCA)发现,DNLs 在蛋白质的 N 端显著富集,这有助于被输入蛋白识别,从而实现蛋白质的核输入过程。
  • 癌症相关突变驱动的异常核定位:研究人员利用 pSAM 模型对癌症相关突变进行分析,发现约 6.7% 的 NLS 区域突变会影响蛋白质核定位。通过对这些突变的进一步研究,发现它们会导致蛋白质功能紊乱,进而影响肿瘤的发生发展。例如,肿瘤抑制因子 TP63 携带特定突变(SAMs)时,其编码蛋白的核定位减少,导致下游靶基因 BLCAP 的表达降低,从而促进肿瘤的进展。此外,研究还发现一些原本定位于细胞质的蛋白,在发生突变后会获得进入细胞核的能力,这可能为肿瘤的发生提供新的机制。
  • 预测核质穿梭扰动的验证:为了验证 pSAM 模型的预测能力,研究人员挑选了 10 个预测对核定位概率有显著影响的突变(SAMs)进行实验验证。结果显示,8 个突变表现出明显的核定位降低,如 KAT8 的 R144C 突变,通过核定位概率轨迹(NLPT)分析和免疫荧光染色证实,该突变显著消除了蛋白质的核定位能力。同时,对 NES 区域的突变扫描实验也证实了 pSAM 模型能够准确预测突变对蛋白质核输出功能的影响。
  • PTEN 突变对其功能的影响:PTEN 是一种重要的肿瘤抑制因子,研究人员对 PTEN 的 R14M 突变进行了深入研究。结果表明,该突变显著改变了 PTEN 的核定位,使其失去了核定位能力。进一步研究发现,PTEN R14M 突变会破坏其对细胞周期和凋亡的调控功能,导致肿瘤生长和集落形成能力增强。在体内肿瘤发生实验中,携带 PTEN R14M 突变的细胞系显著降低了 PTEN 的肿瘤抑制功能,这表明该突变通过调节 PTEN 的核定位,破坏了其正常的肿瘤抑制功能。
  • SAM 携带基因网络与肿瘤发生的关系:研究人员构建了一个与肿瘤发生相关的基因网络,通过整合携带核 SAMs 的基因和癌症标志性通路,来揭示核 SAMs 在人类癌症中的作用。结果发现,这些基因大多与癌症相关,包括许多已知的癌症相关基因、药物靶点、酶和转移相关基因 。富集分析显示,核 SAMs 显著影响了多种癌症标志性特征,如持续增殖、逃避生长抑制信号、免疫逃逸等,这表明核 SAMs 通过影响蛋白质的核质穿梭,在肿瘤发生发展过程中发挥着关键作用。

在研究结论与讨论部分,该研究首次系统地识别了不同核定位的序列决定因素,并在残基水平上可视化了蛋白质核定位概率的贡献。通过实验验证,揭示了突变改变蛋白质亚细胞穿梭从而驱动肿瘤发生的一般机制。虽然目前无法对所有突变进行验证,但实验所证实的预测结果支持了 pSAM 模型的有效性,该模型有助于深入研究蛋白质核质穿梭的分子机制,为进一步的实验研究提供了候选对象。此外,研究还发现 DNLs 区域与 DNA 结合域高度相关,这暗示了锌指结构域在蛋白质核定位中的潜在作用。同时,研究人员推测一些不包含典型 NLS - like/NES - like DNLs 的蛋白质可能通过特定途径进入细胞核,这为后续研究蛋白质的核定位机制提供了新的方向。然而,该研究也存在一定的局限性,如核定位的正数据集可靠但负数据集存在挑战,蛋白质靶向肽比例有限导致已知 NLSs/NESs 与识别的 DNLs 一致性较低,以及环境条件对蛋白质亚细胞定位的影响难以评估等。但总体而言,这项研究为理解肿瘤发生的分子机制提供了新的视角,为癌症的诊断和治疗开辟了潜在的新方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号