Glycoprotein-Notebook:基于完整糖肽的泛癌糖蛋白质组学数据库与癌症表型分析工具

【字体: 时间:2025年10月15日 来源:Molecular & Cellular Proteomics 5.5

编辑推荐:

  针对糖蛋白质组学缺乏专用数据库和分析工具的瓶颈,研究人员开发了“Glycoprotein-Notebook”在线资源,整合了CPTAC项目中10种癌症的完整糖肽质谱数据,提供从差异表达、亚型分析到糖基化-磷酸化串扰的深度分析功能。以胰腺癌(PDAC)为案例验证了该工具在发现癌症特异性诊断标志物和治疗靶点方面的潜力,为探索蛋白质糖基化与癌症表型关系提供了宝贵资源。

  
蛋白质糖基化作为一种重要的翻译后修饰,在细胞识别、信号传导、免疫应答等生物学过程中发挥着关键作用。特别是在癌症发展中,糖基化模式的改变与肿瘤进展、转移和免疫逃逸密切相关。然而,由于糖基化的非模板化特性、结构复杂性和微不均一性,糖蛋白质组学研究一直面临巨大挑战。虽然质谱技术的进步使得完整糖肽(IGP)的鉴定成为可能,但专门针对糖蛋白质组学分析的数据库和工具仍然匮乏,这严重阻碍了研究人员对癌症中糖基化改变的系统性探索。
为了突破这一瓶颈,约翰斯·霍普金斯大学的Hui Zhang、Trung Hoang和Yingwei Hu研究团队开发了名为"Glycoprotein-Notebook"的创新性在线资源,相关研究成果发表在《Molecular》期刊上。这个平台整合了临床蛋白质组肿瘤分析联盟(CPTAC)项目中10种癌症类型的质谱数据,包含432,750个N-连接完整糖肽,覆盖11,641个蛋白质,为癌症糖蛋白质组学研究提供了迄今为止最全面的资源。
研究人员采用了一系列先进的技术方法开展这项研究。他们利用GPQuest 3.0软件从CPTAC项目的质谱数据中鉴定完整糖肽,通过检测氧鎓离子、匹配b/y型碎片离子以及分配完整糖肽三个步骤实现高精度鉴定。研究整合了10种癌症类型(包括乳腺癌、肾癌、结直肠癌、胶质母细胞瘤等)的肿瘤和癌旁组织样本,采用假发现率(FDR)<1%的质量控制标准。数据分析方面,运用了主成分分析(PCA)、差异表达分析、基因集富集分析(GSEA)、非负矩阵分解(NMF)聚类等多种生物信息学方法,并建立了糖基化-磷酸化串扰分析流程。
研究结果展现了多个重要发现。在数据库构建与表征方面,研究人员成功建立了包含10种CPTAC癌症类型糖蛋白表达矩阵的综合性数据库。通过KEGG通路富集分析发现,鉴定到的糖蛋白显著富集在癌症通路、轴突导向、钙信号通路等关键通路中,表明糖蛋白在肿瘤生物学中扮演着核心角色。不同癌症类型表现出特异的糖型调控模式,如肾透明细胞癌(CCRCC)中高甘露糖(HM)糖型显著增加,而岩藻糖基化和唾液酸化的糖型则下调。
在PDAC肿瘤与癌旁组织的差异表达分析中,研究人员鉴定了2,019个差异表达糖型,其中981个显著下调,1,038个显著上调。这些差异表达糖型在上皮间质转化(EMT)、凝血、补体等通路中显著富集。值得注意的是,28个与上调糖肽相关的蛋白质在全局蛋白质水平上并未显示上调,提示糖肽表达可能提供超越传统蛋白质和mRNA信息的额外价值。
糖基化生物合成通路分析揭示了111个糖基化酶的表达模式,其中超过半数在蛋白质水平被检测到。RNA与蛋白质表达水平呈现中等相关性(中位相关系数0.31-0.49),表明存在转录后调控层。大多数糖基化酶在肿瘤样本中上调,但PDAC和UCEC例外。
在PDAC分子亚型中的糖蛋白质组学分析显示,基于糖型的NMF聚类识别出三个簇(IGP1-3),这些簇与多组学定义的C1/C2亚型和xCell定义的肿瘤微环境亚型具有显著关联。IGP3主要与C2亚型和xCell B亚型相关,表现出更侵袭性的肿瘤表型和免疫排斥特征。生存分析表明,结合糖型聚类和多组学聚类能够提供更好的预后分层。
糖基化-磷酸化串扰分析揭示了有趣的现象。在2,163个同时具有糖基化和磷酸化修饰的蛋白质中,这些蛋白质在细胞通讯、粘附和信号转导通路中显著富集。肿瘤样本中糖型与磷酸化位点之间的相关性显著降低,表明肿瘤发生过程中协调调控的破坏。EMT通路中的糖蛋白(如ANPEP、FBLN5、LRP1等)和磷酸化蛋白(如AHNAK、CEP170、SRRM2等)成为失去关联的主要枢纽。
研究结论表明,Glycoprotein-Notebook作为一个新颖的糖蛋白质组学数据库和分析工具,为癌症研究提供了强大的资源平台。通过差异表达分析、糖基化生物合成酶分析、糖型亚分型分析、生存分析和糖基化-磷酸化串扰分析等多种分析模块,该工具展示了在发现肿瘤诊断标志物、预后指标和治疗靶点方面的巨大潜力。研究发现糖蛋白在癌症中广泛参与EMT、凝血、补体等关键通路,糖型模式与肿瘤分子亚型和免疫特征密切相关。特别是糖基化-磷酸化串扰的破坏揭示了肿瘤中PTM协调调控的失调,为理解肿瘤发生机制提供了新视角。
这项研究的重要意义在于首次建立了针对完整糖肽的泛癌糖蛋白质组学资源,解决了该领域长期缺乏专用工具的瓶颈问题。通过整合多组学数据和提供交互式分析平台,Glycoprotein-Notebook不仅促进了糖蛋白质组学数据的可及性和可解释性,还为发现癌症特异性糖基化生物标志物和治疗靶点提供了新途径。研究人员强调,虽然当前版本主要包含CPTAC数据,但该平台 readily extensible to support other cohort-based glycoproteomics studies,有望成为糖蛋白质组学领域的重要基础设施。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号