
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于MS1特征库的虚拟运行间匹配定量技术GlyPep-Quant显著提升位点特异性糖基化鉴定精度
【字体: 大 中 小 】 时间:2025年07月16日 来源:Nature Communications 14.7
编辑推荐:
本研究开发了GlyPep-Quant工具,通过机器学习模型和创新的虚拟运行间匹配策略,解决了糖蛋白质组学中位点特异性糖链定量覆盖率低的关键问题。研究人员建立了MS1特征库驱动的定量方案,使糖肽鉴定量提升8倍以上,并发现胃癌诊断新型生物标志物——α-1-抗胰凝乳蛋白酶(P01011-N127)和皮质类固醇结合球蛋白(P08185-N96)位点的糖链丰度比(AUC>0.95)。该技术为糖基化异质性研究提供了突破性方法。
糖基化修饰作为癌症的重要标志物,其位点特异性分析长期受限于质谱数据解析率低和定量缺失值问题。传统DDA(数据依赖性采集)模式因糖肽谱图解释率不足,导致大规模临床队列研究中糖链定量重现性差,阻碍了糖基化生物标志物的临床转化。中国科学院大连化学物理研究所的研究团队在《Nature Communications》发表的研究中,开发出GlyPep-Quant创新平台,通过整合机器学习与特征库策略,实现了糖蛋白质组学的突破性进展。
研究采用三步核心技术:1)基于随机森林模型评估LFQ-MBR(无标记定量-运行间匹配)置信度,建立两步洗脱曲线提取法;2)利用胃癌患者血清队列(发现集70例/验证集30例)构建MS1特征库;3)开发动态编程算法解决糖肽异构体共洗脱难题。通过DBSCAN聚类将40,000个MS1特征整合为定量库,实现新数据单次分析即可获得16,758个位点特异性糖链定量结果。
高级LFQ-MBR方法提升定量性能
通过核心岩藻糖基化糖肽敲除数据集验证,GlyPep-Quant定量准确率显著优于pGlycoQuant等工具,缺失值比例降低25.1%-178.9%。跨物种评估显示假阳性率仅0.93%,且混合样本定量倍数变化最接近理论值(人类糖肽R2=0.992)。
位点特异性糖链比例揭示新型生物标志物
在胃癌队列中发现α-1-抗胰凝乳蛋白酶(AACT)位点P01011-N127上唾液酸-Lewisx结构(H7N6S4F2)与H6N5S3糖链的比例(AUC=0.987),以及皮质类固醇结合球蛋白(CBG)位点P08185-N96的H7N6S3/H5N4S2比例(AUC=0.954)。这些比值克服了个体表达差异,在独立验证队列中保持85%诊断准确率。
MS1特征库实现单样本深度覆盖
库驱动虚拟MBR使新数据糖肽鉴定量提升8倍,95.7%理论可匹配谱图被成功召回。通过动态编程优化的特征簇匹配算法(FC算法),将时间复杂度从O(n×mn)降至O(n×m2),有效区分共洗脱异构体。
该研究创立了糖链比例分析新范式,突破传统单糖链定量的局限性。特征库策略使单个样本分析即可达到既往大队列研究深度,为糖基化临床检测提供可推广方案。技术框架已整合至Glyco-Decipher软件,将推动糖蛋白质组学在精准医学中的应用。
生物通微信公众号
知名企业招聘