基于MS1特征库的虚拟运行间匹配定量技术GlyPep-Quant显著提升位点特异性糖基化鉴定精度

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月16日 来源：Nature Communications 14.7

编辑推荐：

　　本研究开发了GlyPep-Quant工具，通过机器学习模型和创新的虚拟运行间匹配策略，解决了糖蛋白质组学中位点特异性糖链定量覆盖率低的关键问题。研究人员建立了MS1特征库驱动的定量方案，使糖肽鉴定量提升8倍以上，并发现胃癌诊断新型生物标志物——α-1-抗胰凝乳蛋白酶（P01011-N127）和皮质类固醇结合球蛋白（P08185-N96）位点的糖链丰度比（AUC>0.95）。该技术为糖基化异质性研究提供了突破性方法。

糖基化修饰作为癌症的重要标志物，其位点特异性分析长期受限于质谱数据解析率低和定量缺失值问题。传统DDA（数据依赖性采集）模式因糖肽谱图解释率不足，导致大规模临床队列研究中糖链定量重现性差，阻碍了糖基化生物标志物的临床转化。中国科学院大连化学物理研究所的研究团队在《Nature Communications》发表的研究中，开发出GlyPep-Quant创新平台，通过整合机器学习与特征库策略，实现了糖蛋白质组学的突破性进展。

研究采用三步核心技术：1）基于随机森林模型评估LFQ-MBR（无标记定量-运行间匹配）置信度，建立两步洗脱曲线提取法；2）利用胃癌患者血清队列（发现集70例/验证集30例）构建MS1特征库；3）开发动态编程算法解决糖肽异构体共洗脱难题。通过DBSCAN聚类将40,000个MS1特征整合为定量库，实现新数据单次分析即可获得16,758个位点特异性糖链定量结果。

高级LFQ-MBR方法提升定量性能

通过核心岩藻糖基化糖肽敲除数据集验证，GlyPep-Quant定量准确率显著优于pGlycoQuant等工具，缺失值比例降低25.1%-178.9%。跨物种评估显示假阳性率仅0.93%，且混合样本定量倍数变化最接近理论值（人类糖肽R²=0.992）。

位点特异性糖链比例揭示新型生物标志物

在胃癌队列中发现α-1-抗胰凝乳蛋白酶（AACT）位点P01011-N127上唾液酸-Lewis^x结构（H7N6S₄F₂）与H6N5S₃糖链的比例（AUC=0.987），以及皮质类固醇结合球蛋白（CBG）位点P08185-N96的H7N6S₃/H5N4S₂比例（AUC=0.954）。这些比值克服了个体表达差异，在独立验证队列中保持85%诊断准确率。

MS1特征库实现单样本深度覆盖

库驱动虚拟MBR使新数据糖肽鉴定量提升8倍，95.7%理论可匹配谱图被成功召回。通过动态编程优化的特征簇匹配算法（FC算法），将时间复杂度从O(n×mⁿ)降至O(n×m²)，有效区分共洗脱异构体。

该研究创立了糖链比例分析新范式，突破传统单糖链定量的局限性。特征库策略使单个样本分析即可达到既往大队列研究深度，为糖基化临床检测提供可推广方案。技术框架已整合至Glyco-Decipher软件，将推动糖蛋白质组学在精准医学中的应用。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号