基于精确碎片化模式的质谱谱库注释新方法mineMS2:提升代谢组学结构解析能力

【字体: 时间:2025年07月26日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  研究人员开发了mineMS2这一创新性策略,通过将MS/MS谱图转化为有向无环图(DAG)并运用频繁子图挖掘(FSM)算法,实现了代谢物精确碎片化模式的自动识别。该方法不依赖数据库信息,能发现传统方法遗漏的结构相似性,为代谢组学中的未知化合物鉴定提供了新工具。研究证明其在标准品数据库和生物样本中均能有效捕获结构特征,并与GNPS等分子网络方法形成互补。

  

在代谢组学研究领域,小分子代谢物的结构鉴定始终是重大挑战。虽然高分辨质谱(HRMS)能提供精确分子量,但仅凭此难以确定具体结构。串联质谱(MS/MS)通过分析化合物碎片模式可获取结构信息,但现有方法存在明显局限:数据库依赖性强、无法有效挖掘多谱图间的共同特征、难以处理未知化合物。这些瓶颈严重制约了代谢组学在生物标志物发现等领域的应用深度。

针对这一关键问题,来自法国巴黎萨克雷大学(Université Paris-Saclay)CEA研究所的Alexis Delabriere团队开发了创新性解决方案mineMS2。这项发表在《Journal of Cheminformatics》的研究,提出了一种基于图论和模式挖掘的新策略,实现了代谢物碎片化模式的自动化发现与注释。

研究人员采用三个核心技术方法:(1)将MS/MS谱图转化为基于m/z差值的有向无环图(DAG)表示;(2)开发高效的频繁子图挖掘(FSM)算法提取共同碎片模式;(3)整合分子网络分析增强模式解释性。实验使用622个标准品谱图(LIMS-DB数据集)和103个真菌代谢产物谱图(Penicillium-DB数据集)进行验证。

研究结果部分,通过"化学相关性验证"证实,mineMS2提取的模式能准确解释ChemOnt分类系统中的112个化学概念(F1-score≥0.6)。如图1所示,该方法成功捕获了甲硫氨酸衍生物特征性的NH3和CH4S丢失模式。在"多碰撞能量谱图整合"实验中,合并多能级数据使黄酮醇类化合物的识别准确率从0.4提升至1.0。

特别值得注意的是"与MS2LDA的互补性"分析:70%的化学概念仅能被其中一种方法最佳解释。mineMS2擅长发现精确的m/z差值关系网络(如图2c所示的碎片化图),而MS2LDA更侧重片段离子特征。在"从头鉴定应用"中,该方法成功识别出青霉素真菌中赭曲霉素等7组代谢产物的特征碎片模式,并辅助推定了m/z 416未知物的色氨酸衍生结构(如图6所示)。

研究结论部分强调,mineMS2通过创新的图表示和模式挖掘算法,突破了传统代谢物识别方法的局限。其核心价值体现在三方面:(1)不依赖数据库的精确碎片模式发现;(2)结构化图形表示增强化学可解释性;(3)与分子网络方法的协同增效。这项工作为代谢组学研究提供了新的分析维度,特别在微生物次生代谢产物等未知化合物鉴定方面展现出独特优势。未来通过与MESSAR等子结构预测工具的进一步整合,有望建立更强大的代谢物解析工作流程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号