NetFlow3D:绘制癌症体细胞突变多尺度功能图谱,解锁癌症奥秘新钥匙

【字体: 时间:2025年01月25日 来源:Nature Communications

编辑推荐:

  癌症研究中,为解析体细胞突变驱动机制,研究人员开展 “NetFlow3D:整合蛋白质结构与网络拓扑的癌症体细胞突变多尺度功能图谱构建” 研究。他们构建 NetFlow3D 框架,发现更多 3D 簇和相关网络模块,对理解癌症机制、精准医疗意义重大。

  在癌症的世界里,体细胞获得性突变就像隐藏在黑暗中的 “神秘杀手”,悄无声息地推动着肿瘤的发生发展。长久以来,科学家们都渴望揭开这些突变背后的神秘面纱,弄清楚它们是如何从改变基因组序列开始,一步步影响细胞的正常功能,最终导致癌症的。然而,探索的道路困难重重。一方面,虽然已经有不少计算方法能给突变的致病性打分,但要深入理解每个突变的作用机制,还远远不够。在 3D 蛋白质结构层面,以往的 3D 聚类算法存在诸多局限,比如只能分析实验测定的结构,或者只聚焦单个蛋白质,无法全面覆盖人类所有蛋白质的 3D 结构和已知蛋白质相互作用(PPI)的结合界面,这就使得许多潜在的重要突变信号被遗漏。另一方面,在 PPI 网络层面,虽然有方法能识别显著突变的子网,但这些方法和 3D 结构层面的研究成果大多不重叠,无法形成一个完整的拼图。因此,将这两个层面的研究整合起来,全面描绘癌症机制,成为了癌症研究领域亟待解决的关键问题。
为了攻克这些难题,来自康奈尔大学(Cornell University)的研究人员展开了一项极具意义的研究。他们构建了 NetFlow3D 这一统一的、端到端的 3D 结构信息指导的蛋白质相互作用网络传播框架,旨在绘制癌症体细胞突变的多尺度功能图谱,从原子、残基、蛋白质和网络等多个尺度揭示突变的作用机制。最终,他们成功绘制出多尺度功能图谱,发现了许多新的潜在驱动突变和与癌症相关的网络模块,为理解癌症生物学提供了新的视角,对癌症的诊断、治疗和预后评估具有重要意义。该研究成果发表在《Nature Communications》杂志上。

研究人员在这项研究中运用了多种关键技术方法。首先,他们收集并整合了大量数据,包括来自癌症基因组图谱(TCGA)和癌症体细胞突变目录(COSMIC)的体细胞突变数据、RNA - seq 数据等。接着,通过数据预处理,去除了种系变异、未表达基因中的突变等。然后,构建了人类蛋白质结构组(Human Protein Structurome),包含人类所有蛋白质的 3D 结构和已知 PPI 的结合界面信息。在此基础上,利用 3D 聚类算法识别突变的 3D 簇,结合背景突变率模型确定簇的显著性,并通过网络传播模型将 3D 聚类信号在 PPI 网络中传播,识别相互连接的模块。

研究结果主要包含以下几个方面:

  • NetFlow3D 映射体细胞突变的多尺度功能:NetFlow3D 整合多层面信息,从原子分辨率的 3D 突变聚类,到关键蛋白质 / PPIs 的扰动,再到网络模块和细胞通路的失调,全面映射体细胞突变的功能影响。它通过 3D 聚类算法识别出框架内突变的空间簇,考虑基因组背景突变率和氨基酸残基物理接触等因素;利用热扩散模型在 PPI 网络中传播 3D 聚类信号,根据 3D 突变簇在 PPI 界面的情况赋予传播权重,识别相互连接的模块,还考虑了功能丧失(LOF)突变,将其富集信号纳入热扩散模型。
  • 在人类蛋白质结构组中发现显著的蛋白质内和蛋白质间 3D 簇:对 TCGA 泛癌数据集中的体细胞框架内突变进行分析,NetFlow3D 识别出大量显著的蛋白质内和蛋白质间 3D 簇,其中许多是基于深度学习数据库的 3D 结构数据发现的。这些簇中的残基单独分析时大多不显示显著的复发性突变,但对催化残基有显著富集。与其他 3D 聚类算法相比,NetFlow3D 在识别已知癌症基因方面表现更优,具有更高的灵敏度和特异性。
  • 3D 结构信息和 PPI 网络拓扑整合的重要性:NetFlow3D 将 3D 结构信息与 PPI 网络拓扑无缝整合,相比仅依赖单一信息的方法具有显著优势。在与仅使用 3D 蛋白质结构信息的方法对比中,NetFlow3D 识别的显著相互连接模块中已知癌症基因比例更高,且这些模块与既定生物学过程的一致性更强。与仅依赖 PPI 网络拓扑的方法相比,NetFlow3D 在统计能力上有显著提升,去除其整合 3D 结构信息的关键策略后,识别的相互连接模块包含的蛋白质数量大幅减少。
  • NetFlow3D 识别的显著相互连接模块的生物学意义:对 NetFlow3D 识别的显著相互连接模块(NetFlow3D 模块)进行分析,发现其对已知癌症基因的富集水平与成熟癌症通路相当,且显著高于基因本体(GO)生物学过程。在突变模式分析中,NetFlow3D 模块和成熟癌症通路对特定突变类别都有明显的富集趋势,而 GO 生物学过程则不明显。此外,NetFlow3D 识别的突变与蛋白质丰度、细胞适应性显著相关,对患者生存也有显著影响,并且能揭示出许多未知的与癌症相关的蛋白质和模块。
  • 泛癌体细胞突变的多尺度功能图谱:应用 NetFlow3D 到 TCGA 泛癌数据集,绘制出的多尺度功能图谱涵盖了广泛的细胞过程和功能,包括成熟癌症通路、新认识的通路和蛋白质复合物,以及在癌症中作用尚不明确的生物实体。该图谱不仅包含传统 PPI 网络分析可识别的成分,还包含结合多种数据或分析新发现的成分,以及 NetFlow3D 独特识别的成分,为理解癌症机制提供了更全面的视角。

在结论和讨论部分,NetFlow3D 有效地整合了 3D 蛋白质结构信息和 PPI 网络拓扑,为癌症研究带来了新的突破。它在识别潜在功能残基、3D 簇和显著相互连接模块方面表现卓越,揭示了许多以往未被充分理解的癌症生物学方面。此外,NetFlow3D 不仅适用于泛癌研究,也可用于特定癌症类型的研究,并且其核心原理还可扩展到理解各种疾病中的种系变异。然而,NetFlow3D 也存在一定的局限性,如受限于可用 3D 结构数据的质量,无法完全考虑所有类型的驱动突变。但随着技术的不断进步,这些问题有望得到解决,NetFlow3D 将在癌症研究和其他相关领域发挥更大的作用,为人类攻克癌症这一重大疾病提供有力的支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号