基于复制谱的质谱相似性评分方法研究

【字体: 时间:2025年03月10日 来源:Analytica Chimica Acta 5.7

编辑推荐:

  本研究提出了一种基于复制谱的质谱相似性评分方法,通过统计检验(如Kolmogorov–Smirnov检验和t检验)评估质谱数据的相似性,有效提高了质谱分析的准确性和客观性。

  在质谱分析中,未知化合物(分析物)的鉴定通常依赖于将其质谱与参考库中的质谱进行比对。分析人员通过主观或客观的标准来判断待测质谱是否与库中的某种化合物匹配。然而,电子电离质谱的测量过程本质上是随机的,即使在控制其他实验因素的情况下,质谱测量的变异性也会给结构相似化合物(如异构体)的区分带来困难。例如,甲基苯丙胺和苯乙胺的质谱在视觉上几乎无法区分,即使是经验丰富的分析人员也难以辨别(见图1、图2)。
为了应对这一挑战,研究者们开发了多种用于分类质谱的客观方法,这些方法通常涉及使用相似性评分或匹配因子,为给定的两组质谱分配一个数值(参见文献[1]、[2]、[3])。为了处理测量变异性,一些研究者利用复制质谱测量开发了相似性评分或分类技术。例如,文献[4]、[5]、[6]、[7]中使用了“t检验”统计量,文献[8]、[9]中构建了“高维共识”质谱。
在本研究中,作者基于常见的统计检class="paragraph">olmogorov–Smirnov检验和t检验)构建了几种基于复制的相似性评分。这些评分本质上检验了两组质谱是否属于同一化合物的零假设,并分配一个相应的(伪)p值。这些评分的特点是无参数且“盲”——即评分算法不考虑关于化合物的额外信息,避免了对数据的假设,例如正态性或方差异质性,这些假设可能并不总是成立。此外,在法医学应用中,这种评分方法可以减少分析人员调整参数以获得期望结果的倾向。
作者通过在一组包含25种法医学相关化合物(包括多组异构体)的复制电子电离(EI)质谱上评估这些评分,将其与传统的相似性评分(如余弦相似性)进行比较。研究结果表明,这些新评分在总分类准确率和库匹配准确率方面优于经典评分,并与其他基于复制谱的技术相当。
在研究中,作者固定了一些符号用于后续讨论。质谱用x、y表示,对应的化合物用X、Y表示。化合物X的复制质谱用上标表示为xi,i=1,…,n。本文处理的是“低分辨率”质谱,其m/z值被映射到名义整数值。每个质谱x被表示为欧几里得空间中的一个向量,第t个分量等于m/z值t处的强度值。在后续讨论中,s、t用于表示m/z值,xt用于表示质谱在m/z值t处的强度值。除非另有说明,强度值均采用?2归一化(即∑t(xt)2=1)。
相似性评分被定义为一个[0,1]值的函数,输入为单个质谱对或复制质谱集。所有相似性评分用ΘA表示,下标A表示评分类型。Θ(x,y)表示质谱x和y之间的相似性评分。如果相似性评分以复制质谱为输入,则表示为Θ((x1,…,xn),(y1,…,ym))或Θ((xi),(yj))。
在计算相似性评分方面,余弦相似性评分是最早提出用于质谱比较的一类评分,其变体(也称为“匹配因子”)至今仍在使用(参见文献[1]、[2]、[3])。余弦相似性评分ΘC是质谱x和y向量在欧几里得空间中的归一化内积,具体计算公式为ΘC(x,y)=∑t=1Mxtyt/√(∑t(xt)2)√(∑t(yt)2),其中M是大于x和y中最高质量离子的正整数。由于本文中的质谱已预先归一化,因此可以直接使用该公式进行计算。
在结果与讨论部分,作者通过5次试验,每次试验包括6个复制库质谱和4个复制分析物质谱,对11种相似性评分进行了评估。HDC评分是通过使用每种化合物的5个最显著峰计算得出的。这些评分用于计算库匹配准确率和总分类准确率(见图5)。需要注意的是,选择5个峰是出于减少计算时间和提供一致性的考虑,并非绝对。
在结论部分,作者指出,本研究引入了几种新的基于复制EI质谱的概率相似性评分。这些评分利用Kolmogorov–Smirnov和t检验统计量,比较两组质谱在每个m/z值范围内的强度分布。通过这些检验得到的p值,再通过计算算术平均值、最小值、最大值或调和平均值进行平均。通过将这些评分应用于25种化合物的复制质谱,研究验证了其在质谱分析中的有效性和准确性。
在作者贡献声明中,Amudhan Krishnaswamy-Usha负责撰写初稿、软件开发、方法学研究、调查和概念化;Briana A. Capistran负责撰写初稿、调查和数据整理;Anthony J. Kearsley负责撰写初稿和监督工作。
最后,在免责声明中,作者指出,本研究是美国国家标准与技术研究院(NIST)的官方贡献,不受美国版权法保护。文中提到的某些商业产品仅用于明确说明程序,并不意味着NIST的认可或推荐,也不意味着这些产品是该用途的最佳选择。
在资助信息中,作者提到K-U通过NIST(美国)任务订单号1333ND 23FNB770067获得了资助。
在利益冲突声明中,作者声明他们没有任何可能影响本文报告工作的已知财务利益冲突或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号