基于MS1特征库的虚拟运行间匹配定量技术GlyPep-Quant显著提升位点特异性糖基化鉴定精度

【字体: 时间:2025年07月16日 来源:Nature Communications 14.7

编辑推荐:

  本研究开发了GlyPep-Quant工具,通过机器学习模型和创新的虚拟运行间匹配策略,解决了糖蛋白质组学中位点特异性糖链定量覆盖率低的关键问题。研究人员建立了MS1特征库驱动的定量方案,使糖肽鉴定量提升8倍以上,并发现胃癌诊断新型生物标志物——α-1-抗胰凝乳蛋白酶(P01011-N127)和皮质类固醇结合球蛋白(P08185-N96)位点的糖链丰度比(AUC>0.95)。该技术为糖基化异质性研究提供了突破性方法。

  

糖基化修饰作为癌症的重要标志物,其位点特异性分析长期受限于质谱数据解析率低和定量缺失值问题。传统DDA(数据依赖性采集)模式因糖肽谱图解释率不足,导致大规模临床队列研究中糖链定量重现性差,阻碍了糖基化生物标志物的临床转化。中国科学院大连化学物理研究所的研究团队在《Nature Communications》发表的研究中,开发出GlyPep-Quant创新平台,通过整合机器学习与特征库策略,实现了糖蛋白质组学的突破性进展。

研究采用三步核心技术:1)基于随机森林模型评估LFQ-MBR(无标记定量-运行间匹配)置信度,建立两步洗脱曲线提取法;2)利用胃癌患者血清队列(发现集70例/验证集30例)构建MS1特征库;3)开发动态编程算法解决糖肽异构体共洗脱难题。通过DBSCAN聚类将40,000个MS1特征整合为定量库,实现新数据单次分析即可获得16,758个位点特异性糖链定量结果。

高级LFQ-MBR方法提升定量性能

通过核心岩藻糖基化糖肽敲除数据集验证,GlyPep-Quant定量准确率显著优于pGlycoQuant等工具,缺失值比例降低25.1%-178.9%。跨物种评估显示假阳性率仅0.93%,且混合样本定量倍数变化最接近理论值(人类糖肽R2=0.992)。

位点特异性糖链比例揭示新型生物标志物

在胃癌队列中发现α-1-抗胰凝乳蛋白酶(AACT)位点P01011-N127上唾液酸-Lewisx结构(H7N6S4F2)与H6N5S3糖链的比例(AUC=0.987),以及皮质类固醇结合球蛋白(CBG)位点P08185-N96的H7N6S3/H5N4S2比例(AUC=0.954)。这些比值克服了个体表达差异,在独立验证队列中保持85%诊断准确率。

MS1特征库实现单样本深度覆盖

库驱动虚拟MBR使新数据糖肽鉴定量提升8倍,95.7%理论可匹配谱图被成功召回。通过动态编程优化的特征簇匹配算法(FC算法),将时间复杂度从O(n×mn)降至O(n×m2),有效区分共洗脱异构体。

该研究创立了糖链比例分析新范式,突破传统单糖链定量的局限性。特征库策略使单个样本分析即可达到既往大队列研究深度,为糖基化临床检测提供可推广方案。技术框架已整合至Glyco-Decipher软件,将推动糖蛋白质组学在精准医学中的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号