综述:中药质谱数据库的发展与挑战

《Science of Traditional Chinese Medicine》:Development and challenges of mass spectrometry database for traditional Chinese medicine: A review

【字体: 时间:2025年11月04日 来源:Science of Traditional Chinese Medicine

编辑推荐:

  这篇综述系统梳理了2005-2025年间中药(TCM)与天然产物质谱(MS)数据库的发展现状,详细比较了7个TCM化学组分数据库和7个天然产物数据库的特性、检索方法、数据来源及应用。文章重点探讨了当前数据库在数据质量、标准化、更新时效、交互功能及数据共享安全等方面面临的挑战,并展望了通过开放数据共享、技术创新(如人工智能与机器学习)构建更全面、精准的TCM-MS数据库的未来方向,为中药成分精准鉴定及数据库建设应用提供了理论与实践指导。

  

1. 引言

传统中药(TCM)及其他天然产物通常源自植物、海洋生物和微生物的内源性成分或代谢物,是治疗人类疾病和开发新药的重要宝库。中药化学成分具有结构多样性和复杂性的特点,包含黄酮类、多糖、多酚、生物碱、萜类及苷类等多种化合物。质谱技术因其高灵敏度、高分辨率和快速分析能力,已成为解析中药复杂物质基础的关键技术。质谱能够提供保留时间(RT)、分子量、分子式等详细信息,与色谱技术联用可显著提高化合物检测的特异性和通量。建立全面可靠的中药化学成分液相色谱-质谱(LC-MS)数据库,是实现中药中已知化合物高效鉴定及新化合物发现的最有效途径。

2. 中药化学成分质谱数据库

当前已有多个商业化和专业机构开发的中药质谱数据库,它们在数据规模、来源和功能上各有侧重。
2.1. 中药代谢组学数据库
由上海鹿明生物科技有限公司开发,涵盖《中国药典》及常用中药超过500种,包含5000多种标准化中药对照品,MS/MS数据集超过20,000个,能进行精确的定性分析。但该数据库主要用于商业检测,未公开访问。
2.2. 赛默飞世尔科技高分辨质谱数据库
由赛默飞与清华大学药学院合作开发,基于《中国药典》(2015年版),包含1202种中药对照品的一级和碎片质谱图,生成7124个串联质谱图。其专有数据处理软件可实现基于RT、质荷比、同位素丰度等的精准检索。
2.3. SCIEX中药-MS/MS高分辨质谱数据库
由SCIEX与上海斯丹德生物技术有限公司联合推出,包含超过20,000个一级质谱图和1315个TCM化合物的串联质谱图,采用碰撞能量扩散技术,支持自动化数据处理。
2.4. 安捷伦-自然标准中药个人化合物数据库和谱库
基于《中国药典》(2015年版),包含近2565种天然化合物及超过20,000个高分辨率二级质谱图,可与安捷伦多种软件联用,助力中药活性成分探索。
2.5. 沃特世中药-天然产物数据库
涵盖2020版《中国药典》所有草药及相关化合物超过17,000种,包含碰撞截面值,有助于区分结构相似化合物,并与UNIFI等软件无缝对接。
2.6. 中国科学院上海有机化学研究所化学数据库
包含超过12,000种化合物的质谱数据,涵盖生物碱、氨基酸、黄酮类等,但主要关注已知化合物,不支持批量导入。
2.7. 西北道地药材代谢组学数据库
基于MySQL和Django框架开发,涵盖10种西北药材,包含2410种化合物和2196条质谱记录,支持多模式检索,但数据主要来源于文献,更新已停止。

3. 与中药相关的天然产物质谱数据库

天然产物与中药来源相似,化学成分高度相似,因此天然产物质谱数据库对中药成分快速鉴定具有重要价值。
3.1. 全球天然产物社会分子网络
GNPS是一个基于大规模质谱数据的开放获取分析平台,支持mzXML、mzML、mgf等格式数据,包含22,644种化合物和235,850个质谱图,并提供质谱库搜索、化学结构预测、基于谱图相似性注释等强大工具。其分子网络功能基于MS/MS谱图相似性构建,有助于发现未知化合物及其生物转化途径。
3.2. MassBank
是生命科学领域首个小分子化合物公共质谱数据库,包含19,000个一级质谱图和28,000个二级质谱图。其特色是使用“合并谱图”信息,减少对特定仪器设置的依赖。
3.3. RIKEN串联质谱数据库
ReSpect专注于植物化学物质,包含3595种化合物和8649个质谱数据,76%来源于文献。其基于m/z值的查询系统增强了搜索灵活性。
3.4. mzCloud
是一个高质量质谱数据库,包含32,330种化合物和超过1600万个质谱数据,数据来源于ThermoFisher质谱仪,质量高,每周更新。支持多种搜索方式。
3.5. 生物信息学与分子设计研究中心天然产物质谱库
BMDMS-NP是一个综合性免费ESI-MS/MS谱图库,包含2739种对照品和288,939个MS/MS谱图,数据经过降噪处理,提供灵活的搜索选项。
3.6. 皂苷质谱数据库
SMSD是一个专注于皂苷类化合物的开放获取数据库,包含4196种皂苷,提供分类、搜索和代谢物查询功能。
3.7. PMhub 1.0
是一个综合性植物代谢组学数据库,包含188,938种化合物和279,750个高分辨率MS/MS谱图,整合了基因组、转录组、化学反应和代谢通路等信息,支持批量任务提交。

4. 中药质谱数据库存在的问题

4.1. 数据质量与标准化
数据覆盖范围有限,实验条件波动导致数据稳定性差,不同仪器和数据库的标准与方法不统一,影响了数据的可比性、可靠性和可重复性。需通过标准化流程、数据融合技术及信号处理算法提升数据质量。
4.2. 数据更新不足
相较于mzCloud等数据库的每周更新,许多中药质谱数据库更新周期缓慢。数据来源依赖文献和实验,收集整理耗时;商业数据库更新成本高且用户需求不强烈是主要原因。
4.3. 数据库交互操作与检索功能
部分数据库不支持常见质谱数据格式,需转换;搜索功能单一,缺乏高级检索(如结构搜索、多条件搜索);批量搜索功能不完善,难以满足高通量鉴定需求。
4.4. 数据共享与安全
由于知识产权和数据安全考虑,许多商业数据库限制数据共享,阻碍了数据交流与合作。数据库安全措施可能存在漏洞,导致数据被访问、篡改或滥用。

5. 讨论与展望

中药质谱数据库的发展显著推动了中药研究的现代化。未来,需要在技术层面持续整合先进匹配算法和评分函数,提升检索精度和效率。构建一个开放、全面、精准的中药质谱数据库,促进数据共享生态系统的形成至关重要。持续扩张数据库规模,并探索创新功能模块,如集成人工智能和机器学习等前沿技术,以增强数据处理和分析能力。同时,确保数据安全和隐私保护仍是重中之重。例如,mWISE、MolDiscovery、MassFormer等计算工具和预测模型为化合物注释提供了有力补充,但其适用范围和精度仍有提升空间。借鉴GNPS通过众包扩展谱库和PMhub 1.0整合CFM-ID模拟MS/MS谱图的低成本策略,是未来数据库建设值得考虑的方向。

6. 结论

质谱数据库在中药和天然产物成分的高效鉴定方面展现出巨大潜力。本文综述的14个代表性数据库各有特点,但也共同面临着数据标准化、用户界面不友好、检索功能有限和数据共享不足等挑战。解决这些问题,推动开放、全面的中药质谱数据库的建设,将极大促进中药化学成分研究、代谢组学发展及药物研发等领域的进步。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号