MSFragger-DDA+:基于全隔离窗搜索提升肽段鉴定灵敏度的创新算法

《Nature Communications》:

【字体: 时间:2025年04月09日 来源:Nature Communications

编辑推荐:

  在基于液相色谱 - 质谱(LC-MS)的蛋白质组学研究中,传统数据库搜索工具在处理数据依赖性采集(DDA)质谱数据时,难以准确鉴定共碎裂肽段。研究人员开展了关于 MSFragger-DDA+算法的研究,结果显示该算法能提高肽段鉴定灵敏度,为蛋白质组学数据分析提供了更高效准确的方案。

  在生命科学研究的广袤领域中,蛋白质组学犹如一座神秘的宝藏矿山,蕴含着无数关于生命奥秘的线索。液相色谱 - 质谱(LC-MS)技术作为探索这座矿山的有力工具,尤其是在自下而上的蛋白质组学研究方法中,发挥着至关重要的作用。它先将蛋白质消化成肽段,再对这些肽段进行分离和分析,从而帮助科研人员了解蛋白质的各种信息,包括翻译后修饰、蛋白质 - 蛋白质相互作用等,这些信息对于研究癌症等疾病、SARS-CoV-2 病毒感染机制等有着重要意义。
然而,目前在利用数据依赖性采集(DDA)质谱数据进行肽段鉴定时,却遭遇了重重困难。传统的数据库搜索工具就像戴着有色眼镜的寻宝者,往往只关注单个肽段,忽略了频繁出现的肽段共碎裂现象,导致大量共碎裂肽段在鉴定过程中被遗漏,这就好比在宝藏矿山中,许多珍贵的宝石被视而不见。此外,对于复杂样本,即使使用较窄的隔离窗,仍有相似质量的共洗脱肽段发生共碎裂,产生嵌合的 MS2 光谱,进一步增加了肽段鉴定的难度。而且,现有的工具对于宽窗采集(WWA)DDA 数据的支持也非常有限,这使得科研人员在处理这类数据时常常束手无策。

为了突破这些困境,来自美国密歇根大学(University of Michigan)的研究人员 Fengchao Yu、Yamei Deng 和 Alexey I. Nesvizhskii 勇敢地踏上了探索之旅,开展了关于 MSFragger-DDA+算法的研究。他们的研究成果发表在《Nature Communications》上,为蛋白质组学研究带来了新的曙光。

研究人员为开展这项研究,主要运用了以下关键技术方法:首先是数据库搜索技术,MSFragger-DDA+算法突破传统,对每个串联质谱在全隔离窗内进行全面搜索;其次是利用 FragPipe 计算平台,将 MSFragger-DDA+集成其中,实现从肽段鉴定到定量分析的完整流程;此外,还运用了如前体提取离子色谱(XIC)检测、共享片段去除和重新评分等技术,对搜索结果进行优化。

下面来看看具体的研究结果:

  • MSFragger-DDA+算法概述:MSFragger-DDA+算法在数据库搜索时,与传统算法不同,它对每个 MS2 光谱在全隔离窗内搜索所有肽段,通过 hyperscore 衡量肽段与光谱的相似性。之后,进行前体 XIC 检测、共享片段去除和重新评分等操作。该算法优化了处理速度和内存使用,并且被集成到 FragPipe 计算套件中,方便后续分析。
  • MSFragger-DDA+提高肽段鉴定灵敏度:研究人员使用两个 DDA 数据集进行评估,结果显示,MSFragger-DDA+在不同归一化碰撞能量(NCE)和酶消化、碎裂组合条件下,比传统 DDA 模式的 MSFragger 以及其他工具能鉴定出更多的肽段序列,平均多出 15% - 57%。
  • MSFragger-DDA+具有良好的假发现率控制:通过构建诱捕数据库搜索评估假发现率(FDR),发现 MSFragger-DDA+不仅鉴定出的目标肽段序列和蛋白质数量最多,而且 FDR 与 MSFragger 相似,比其他工具更低。
  • MSFragger-DDA+在 DDA-PASEF 数据分析中的应用:在分析 timsTOF DDA-PASEF 数据时,MSFragger-DDA+耦合 FragPipe 比传统 DDA 工作流程具有更高的灵敏度,能定量更多的蛋白质。虽然在匹配运行间(MBR)启用时差异缩小,但 DDA+工作流程仍能定量更多蛋白质。在定量质量方面,不同工作流程鉴定出的蛋白质变异系数(CV)存在差异,DDA+工作流程定量的蛋白质缺失值比例与传统工作流程相当。
  • MSFragger-DDA+对宽窗采集数据的支持:利用多个 WWA 数据集研究发现,MSFragger-DDA+在处理这类数据时表现出色,与其他工具相比,能鉴定出更多的肽段或定量更多的蛋白质,且速度更快,例如在分析某数据集时,比 CHIMERYS 和 Proteome Discoverer 快至少 20 倍。
  • MSFragger-DDA+在磷酸蛋白质组数据分析中的优势:在分析磷酸化富集数据时,MSFragger-DDA+比传统 DDA 模式的 MSFragger 能鉴定出更多的磷酸化位点(约多 5%)和磷酸化序列(约多 14%)。
  • MSFragger-DDA+助力检测更多差异表达蛋白质和基因:通过分析 IDH 突变的胶质瘤患者数据集,发现 MSFragger-DDA+耦合 FragPipe 能鉴定出更多的蛋白质,减少缺失值,从而检测出更多的差异表达蛋白质和基因,在癌症蛋白质组学分析中具有重要意义。

研究结论和讨论部分指出,MSFragger-DDA+算法打破了传统 DDA 肽段鉴定策略的局限,通过全隔离窗搜索和独特的重新评分机制,能够更敏锐地识别低丰度、共碎裂的肽段。在单细胞蛋白质组学研究中,它为分析低输入样本提供了有力支持,极大地拓展了蛋白质组覆盖深度,而且其快速的处理速度也解决了单细胞研究数据处理的瓶颈问题。同时,MSFragger-DDA+是 MSFragger 工具家族的重要一员,它统一了不同数据采集模式下的肽段鉴定流程,为蛋白质组学研究提供了更通用、更高效的解决方案。不过,该算法也存在一些局限性,比如在处理某些特定场景(如基于等压标记的定量工作流程)时可能效果不佳,且目前不支持开放或质量偏移搜索,限制了其在未知翻译后修饰鉴定和发现中的应用。但总体而言,MSFragger-DDA+算法的出现,为蛋白质组学研究开辟了新的道路,推动了生命科学和健康医学领域的发展,让我们在探索生命奥秘的征程中又迈出了坚实的一步。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号