创建了一个开放获取的高分辨率串联质谱库,涵盖了1000种食品毒素

《Analytical Chemistry》:Creation of an Open-Access High-Resolution Tandem Mass Spectral Library of 1000 Food Toxicants

【字体: 时间:2025年10月24日 来源:Analytical Chemistry 6.7

编辑推荐:

  食品安全中高效液相色谱-高分辨质谱联用技术(LC-HRMS/MS)的化合物注释依赖高质量的质谱谱库。本研究构建了WFSR食品安全质谱谱库,包含1001种化合物、6993条HRMS/MS谱,涵盖农药残留、兽药、天然毒素等四类食品危害物质。谱库采用标准化条件获取,包含七种碰撞能数据,并通过多方法验证其准确性:与GNPS、MassBank等公共数据库对比发现22.2%的化合物为独有,且验证了其谱图质量优于现有资源。该库通过FAIR原则开放,支持结构相似性分析及机器学习应用。

  在食品安全性研究中,化合物的识别与注释是至关重要的环节。随着分析技术的发展,特别是高分辨率液相色谱-串联质谱(LC-HRMS/MS)的广泛应用,科学家们能够更精确地检测和鉴定食品中的复杂化合物。然而,尽管现有的质谱数据库在数量上已经大幅增长,它们仍然面临诸多挑战,包括数据异质性高、谱图质量参差不齐以及获取权限受限等问题。这些问题在食品检测中尤为突出,因为缺乏全面的参考数据使得识别有害物质变得困难重重。为了解决这些局限,研究人员开发了WFSR食品安全性质谱库,这是一个专注于食品污染物、残留物和有害化合物的自由开放的串联质谱数据库。

该数据库包含从1001种化合物中获取的6993条经过人工校对的谱图,这些谱图均在正离子模式下使用超高性能液相色谱(UHPLC)与Orbitrap IQ-X三重质谱仪采集。在标准化条件下,每种化合物的谱图均记录在七个不同的碰撞能量下。数据库中还提供了详尽的元数据,包括通用名称、CAS编号、SMILES结构、InChI键、保留时间以及化合物类别。为了促进社区的再利用,该数据库通过专门的网站和GNPS仓库向公众开放,并遵循FAIR数据原则,确保数据的可发现性、可访问性、可互操作性和可重用性。

与主要的质谱数据库(如GNPS、MassBank、MoNA和MSnLib)进行比较后发现,有216种化合物(占库中化合物总数的22.2%)是WFSR库独有的。进一步的分析表明,大约38%的化合物在公共数据库中没有可靠的匹配。WFSR库的设计目标是提高食品中有害物质的注释能力,并通过计算工具实现对结构类似物的识别。此外,该库还计划在未来更新中加入负离子模式的谱图,并扩大化合物的种类,以进一步推动食品安全性监测的发展。

食品安全性是公共健康的重要议题,需要有效检测食品基质中的有害物质以保障消费者的健康。然而,明确识别食品中广泛存在的化学危害仍然充满挑战。LC-HRMS/MS技术是检测和鉴定中高极性化合物的首选方法,尤其是在复杂的食品和环境样品基质中。与靶向方法不同,非靶向LC-HRMS旨在全面分析样品中所有可检测的分析物,而不预先知道它们的身份。然而,非靶向LC-HRMS产生的大量数据需要可靠的工具进行化合物的注释和识别。通常,化合物的识别涉及将采集的谱图与参考标准进行比较,而化合物的注释则是在未知质谱特征的基础上,通过匹配其精确质量、串联质谱图或同位素模式来赋予初步身份或描述。因此,最常见的化合物注释方法是使用质谱库进行搜索。

随着技术的进步,LC-MS/MS适用的质谱库已经从数万条扩展到数百万条。这些质谱库涵盖了从数十万种化合物中获取的数据。尽管它们的价值无可否认,但生成全面的参考质谱库需要大量的资源和质量检查。一些大型和广泛使用的质谱库,如NIST、mzCloud和METLIN,虽然提供了丰富的数据,但仅限于商业授权。幸运的是,一些开放获取和免费使用的质谱库,如GNPS、MassBank、MoNA和MSnLib,已经显著增长,并向公众开放。这些数据库为研究人员提供了宝贵的资源,但它们在食品有毒物质方面的代表性仍然有限。

为了填补这一数据空白,研究人员构建了一个包含1001种化合物和6993条HRMS/MS谱图的质谱库。该库涵盖了食品安全性实验室中监测的多种化合物类别,包括有机污染物、天然毒素、农药、兽药和相关的代谢物。该库提供了独特的谱图数据,这些数据在公共数据库中通常不完整或缺失。谱图是在七个不同的碰撞能量下采集的,并通过计算工具进行了人工校对和验证,以确保其在食品安全性应用中的可靠性和稳健性。

此外,该库还计划在未来更新中加入负离子模式的谱图,以扩大化合物的种类。负离子模式的谱图在公共数据库中仍然较少见,因此这一扩展将为跨离子模式的比较和基于串联质谱图的化学相似性预测提供新的可能性。通过这些努力,WFSR库旨在成为食品安全性研究中的重要工具,帮助科学家们更高效地识别有害物质。

在构建该库的过程中,研究人员采用了多种方法进行数据处理和校验。首先,他们使用了380个原始文件,这些文件来源于标准混合物或单个化合物的UHPLC-HRMS/MS分析。这些原始文件被导入到mzVault软件中,经过转换后生成化合物列表,并用于构建质谱库。对于每个化合物,研究人员根据其名称和分子式从ChemSpider中检索了相关的元数据,并通过系统化的流程进行了校对和修正。这一过程包括从内部数据库中检索CAS编号,再通过PubChem进行验证,确保准确获取化合物的母体信息。最终的质谱库文件包含了1001种独特的化合物和6993条HRMS/MS谱图。

在数据处理过程中,研究人员还利用了多种计算工具和平台。例如,通过GNPS平台进行分子网络分析和库注释,以及使用MS2Query软件进行基于机器学习的谱图匹配。这些方法帮助研究人员评估了质谱库的准确性和可靠性。通过这些工具,研究人员能够更全面地分析化合物的相似性,并识别结构类似物。此外,这些计算工具还能够预测未知谱图的结构和化学类别,从而提高食品安全性监测的效率和准确性。

在实验过程中,研究人员还进行了质量控制(QC)混合物的分析,以确保数据采集的重复性和一致性。QC混合物在每次色谱序列的开始和结束时进行分析,结果显示34种化合物在所有26次进样中表现出稳定的质谱精度、保留时间和信号强度。这些结果表明仪器在长时间内的性能具有良好的重复性。通过这些QC混合物,研究人员能够验证数据采集的一致性,并确保质谱库的可靠性。

此外,研究人员还通过分子网络分析和库注释评估了质谱库的化学空间覆盖情况。分子网络分析揭示了不同化合物之间的相似性,这些相似性通常反映了它们的结构特征。通过这些分析,研究人员能够更全面地了解质谱库的覆盖范围,并确保其在食品安全性应用中的有效性。同时,这些分析还帮助研究人员识别了可能的错误,并进行了相应的修正,以提高质谱库的准确性。

在技术验证过程中,研究人员还利用了多种方法进行评估。这些方法包括分析QC样品、通过GNPS进行分子网络分析和库注释,以及使用MS2Query进行基于机器学习的谱图匹配。通过这些方法,研究人员能够更全面地评估质谱库的准确性和可靠性。例如,通过分析QC样品,研究人员能够验证仪器在长时间内的性能稳定性,确保数据采集的一致性。通过GNPS平台进行分子网络分析,研究人员能够更直观地了解不同化合物之间的相似性,并评估质谱库的覆盖范围。通过MS2Query进行谱图匹配,研究人员能够进一步验证质谱库的准确性,并确保其在食品安全性应用中的有效性。

这些技术验证的结果表明,WFSR库在食品安全性研究中具有重要的价值。通过这些方法,研究人员能够确保质谱库的准确性和可靠性,并为食品安全性监测提供坚实的基础。此外,WFSR库的开放性使得研究人员能够更方便地访问和使用这些数据,从而推动食品安全性研究的发展。通过这些努力,WFSR库不仅填补了现有数据的空白,还为未来的食品安全性监测提供了新的工具和方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号