从MS1到Structure:基于Van Krevelen-DBE-芳香性框架的专有代谢物高分辨率质谱注释方法

《RAPID COMMUNICATIONS IN MASS SPECTROMETRY》:From MS1 to Structure: A Van Krevelen–DBE–Aromaticity-Based Framework for Annotating Specialized Metabolites via High-Resolution Mass Spectrometry

【字体: 时间:2025年09月27日 来源:RAPID COMMUNICATIONS IN MASS SPECTROMETRY 1.7

编辑推荐:

  高分辨率质谱(HRMS)一级数据结合Van Krevelen分析和双键当量(DBE)计算,建立了一种无依赖MS/MS的专用代谢物分类框架。通过分析600+已知分子式的植物代谢物,发现DBE与H/C、O/C比值可区分黄酮类(DBE 9-20)、酚酸类(DBE 5-11)和萜类衍生物(DBE 5-13),在Eugenia jambolana案例中准确注释了phenolic acids(DBE 6)、flavonoids(DBE 12)和saponins(DBE 8)。该方法显著提升未靶向代谢组学中Level 3注释可靠性,尤其适用于复杂植物样本。

  在当前的代谢组学研究中,对复杂生物样本中专性代谢物的分类是一个极具挑战性的任务。传统的代谢物分析方法通常依赖于高分辨率质谱(HRMS)技术,特别是基于一级质谱(MS1)的数据进行非靶向代谢物分析。然而,仅依靠MS1数据往往难以准确区分结构相似的代谢物类别,尤其是在植物来源的代谢物中,由于其化学结构的多样性与复杂性,这种分类的准确性受到了限制。因此,开发一种能够有效提升MS1数据下代谢物分类准确性的方法显得尤为重要。本文提出了一种结合Van Krevelen分析(H/C与O/C原子比)和双键当量(DBE)计算的化学信息学框架,旨在提高非靶向代谢组学中代谢物类别注释的可信度,并且无需依赖MS2碎片信息即可实现更精确的分类。

在代谢组学领域,随着高通量分析技术的发展,研究者们能够检测到越来越多的代谢物。然而,这些数据的处理和解释仍面临诸多挑战,尤其是在缺乏MS2碎片信息的情况下。MS2数据通常能够提供更详细的分子结构信息,但其获取过程较为繁琐,且在非靶向分析中往往仅覆盖部分MS1特征。相比之下,MS1数据具有更高的覆盖范围,能够更全面地揭示样本中的化学多样性。本文提出的框架正是为了弥补这一不足,通过引入Van Krevelen图谱和DBE计算,为MS1数据下的代谢物分类提供了新的视角和工具。

Van Krevelen图谱最初用于描述煤炭成分及其反应过程,后来被广泛应用于复杂混合物的HRMS数据分析中。该图谱通过氢碳比(H/C)和氧碳比(O/C)的二维分布,能够直观展示不同代谢物类别的化学空间特征。然而,传统方法在区分结构相近的代谢物类别时往往存在分辨率不足的问题,难以提供足够的信息支持分类。本文通过将Van Krevelen图谱与DBE值相结合,构建了一个更加全面的化学描述体系,从而在不依赖MS2碎片数据的前提下,提升了代谢物类别注释的准确性。

具体而言,该框架通过整合分子式数据,提取出H/C和O/C原子比,构建Van Krevelen图谱,并进一步利用DBE值来评估结构复杂性和芳香性特征。这种多维度的化学描述方法不仅能够区分代谢物的结构特征,还能够揭示其生物合成路径和化学性质。例如,在研究酚类化合物时,通过Van Krevelen图谱可以观察到不同子类(如黄酮类、酚酸类、单宁类等)在H/C和O/C轴上的分布差异,而DBE值则进一步细化了这些差异,使得原本难以区分的代谢物类别能够被更清晰地识别。

对于含氮化合物,如生物碱,其分类同样面临挑战。传统方法依赖于MS2碎片数据进行结构解析,而本文提出的方法则通过H/C、O/C和DBE值的结合,能够更有效地识别这些化合物的类别。例如,生物碱通常具有一个或多个氮原子,这导致其DBE值为非整数,从而与其他不含氮的代谢物类别区分开来。此外,不同生物碱类别的DBE值范围也存在差异,例如,吲哚类生物碱的DBE值范围较广,而某些特定结构的生物碱(如喹啉类)则表现出更高的DBE值。通过这种综合分析,研究者可以在不依赖MS2数据的情况下,更准确地注释生物碱类别,并识别其可能的结构特征。

对于萜类衍生物,其分类同样受益于本文提出的框架。萜类化合物通常具有较长的碳链和相对较低的氧含量,这使得它们在Van Krevelen图谱中呈现出特定的分布模式。然而,由于其结构的复杂性和多样性,仅凭H/C和O/C比值难以实现精确分类。DBE值的引入则弥补了这一缺陷,因为它能够反映分子中双键和环状结构的数量,从而帮助区分不同类型的萜类化合物。例如,三萜类化合物通常具有较高的DBE值,而甾体类化合物则由于其结构中环的数量较少,DBE值相对较低。通过结合这些化学参数,研究者能够更有效地识别和分类萜类衍生物,尤其是在缺乏MS2数据的情况下。

此外,本文还通过一个实际案例——巴西药用植物“Eugenia jambolana”果实提取物的非靶向代谢组学分析,验证了所提出框架的有效性。在该案例中,通过MS1数据构建的Van Krevelen图谱和DBE分布图,能够清晰地识别出主要的代谢物类别,包括酚类化合物、含氮化合物和萜类衍生物。结果表明,该方法在复杂植物样本中具有良好的适用性,并且能够有效排除一些不符合预期的代谢物类别。例如,通过分析DBE值和H/C、O/C比值,研究者能够识别出高丰度的糖苷化黄酮类化合物,以及具有特定芳香性特征的单宁类化合物。这一案例不仅验证了框架的实用性,也展示了其在非靶向代谢组学中的巨大潜力。

在实际应用中,该框架的优势在于其无需依赖MS2数据,因此能够显著提高非靶向代谢组学的效率和覆盖范围。这对于那些难以获得MS2数据的复杂样本,尤其是非模式物种或未充分研究的植物样本,具有重要的意义。同时,该方法也能够在不牺牲分类准确性的前提下,为代谢物注释提供更多的信息维度。例如,通过将DBE值与碳原子数量结合,研究者可以更全面地评估代谢物的结构特征,从而实现更精确的分类。

从更广泛的角度来看,本文提出的方法不仅适用于植物样本,也可以推广到其他复杂生物样本的代谢组学研究中。随着高通量分析技术的不断发展,越来越多的代谢物被检测到,但如何在缺乏详细结构信息的情况下进行分类仍然是一个关键问题。本文的框架通过引入Van Krevelen图谱和DBE计算,为这一问题提供了一个可行的解决方案,同时也为未来代谢组学研究中数据处理和注释方法的优化奠定了基础。

此外,该方法还具有良好的可扩展性,能够适应大规模的代谢物数据集。通过整合分子式数据,研究者可以构建出更加精细的化学描述模型,从而提高代谢物分类的准确性。例如,在分析含氮化合物时,通过结合DBE值和H/C、O/C比值,可以区分出不同结构的生物碱类别,而无需依赖复杂的MS2碎片数据。这种方法不仅减少了实验成本,还提高了数据处理的效率,使得非靶向代谢组学在研究复杂生物系统时更加实用。

综上所述,本文提出了一种基于MS1数据的化学信息学框架,结合Van Krevelen图谱和DBE值,以提高代谢物类别注释的准确性。这一方法不仅能够有效区分结构相似的代谢物类别,还能够在复杂样本中实现更全面的代谢物覆盖。通过实际案例的验证,该框架展示了其在非靶向代谢组学中的巨大潜力,并为未来代谢物分类研究提供了新的思路和工具。随着代谢组学技术的不断发展,这种方法有望在更广泛的生物样本分析中得到应用,从而推动该领域的进一步发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号