综述:中药质谱数据库的发展与挑战
《Science of Traditional Chinese Medicine》:Development and challenges of mass spectrometry database for traditional Chinese medicine: A review
【字体:
大
中
小
】
时间:2025年11月04日
来源:Science of Traditional Chinese Medicine
编辑推荐:
这篇综述系统梳理了2005-2025年间中药(TCM)与天然产物质谱(MS)数据库的发展现状,详细比较了7个TCM化学组分数据库和7个天然产物数据库的特性、检索方法、数据来源及应用。文章重点探讨了当前数据库在数据质量、标准化、更新时效、交互功能及数据共享安全等方面面临的挑战,并展望了通过开放数据共享、技术创新(如人工智能与机器学习)构建更全面、精准的TCM-MS数据库的未来方向,为中药成分精准鉴定及数据库建设应用提供了理论与实践指导。
1. 引言
传统中药(TCM)及其他天然产物通常源自植物、海洋生物和微生物的内源性成分或代谢物,是治疗人类疾病和开发新药的重要宝库。中药化学成分具有结构多样性和复杂性的特点,包含黄酮类、多糖、多酚、生物碱、萜类及苷类等多种化合物。质谱技术因其高灵敏度、高分辨率和快速分析能力,已成为解析中药复杂物质基础的关键技术。质谱能够提供保留时间(RT)、分子量、分子式等详细信息,与色谱技术联用可显著提高化合物检测的特异性和通量。建立全面可靠的中药化学成分液相色谱-质谱(LC-MS)数据库,是实现中药中已知化合物高效鉴定及新化合物发现的最有效途径。
2. 中药化学成分质谱数据库
当前已有多个商业化和专业机构开发的中药质谱数据库,它们在数据规模、来源和功能上各有侧重。
由上海鹿明生物科技有限公司开发,涵盖《中国药典》及常用中药超过500种,包含5000多种标准化中药对照品,MS/MS数据集超过20,000个,能进行精确的定性分析。但该数据库主要用于商业检测,未公开访问。
由赛默飞与清华大学药学院合作开发,基于《中国药典》(2015年版),包含1202种中药对照品的一级和碎片质谱图,生成7124个串联质谱图。其专有数据处理软件可实现基于RT、质荷比、同位素丰度等的精准检索。
2.3. SCIEX中药-MS/MS高分辨质谱数据库
由SCIEX与上海斯丹德生物技术有限公司联合推出,包含超过20,000个一级质谱图和1315个TCM化合物的串联质谱图,采用碰撞能量扩散技术,支持自动化数据处理。
2.4. 安捷伦-自然标准中药个人化合物数据库和谱库
基于《中国药典》(2015年版),包含近2565种天然化合物及超过20,000个高分辨率二级质谱图,可与安捷伦多种软件联用,助力中药活性成分探索。
涵盖2020版《中国药典》所有草药及相关化合物超过17,000种,包含碰撞截面值,有助于区分结构相似化合物,并与UNIFI等软件无缝对接。
包含超过12,000种化合物的质谱数据,涵盖生物碱、氨基酸、黄酮类等,但主要关注已知化合物,不支持批量导入。
基于MySQL和Django框架开发,涵盖10种西北药材,包含2410种化合物和2196条质谱记录,支持多模式检索,但数据主要来源于文献,更新已停止。
3. 与中药相关的天然产物质谱数据库
天然产物与中药来源相似,化学成分高度相似,因此天然产物质谱数据库对中药成分快速鉴定具有重要价值。
GNPS是一个基于大规模质谱数据的开放获取分析平台,支持mzXML、mzML、mgf等格式数据,包含22,644种化合物和235,850个质谱图,并提供质谱库搜索、化学结构预测、基于谱图相似性注释等强大工具。其分子网络功能基于MS/MS谱图相似性构建,有助于发现未知化合物及其生物转化途径。
是生命科学领域首个小分子化合物公共质谱数据库,包含19,000个一级质谱图和28,000个二级质谱图。其特色是使用“合并谱图”信息,减少对特定仪器设置的依赖。
ReSpect专注于植物化学物质,包含3595种化合物和8649个质谱数据,76%来源于文献。其基于m/z值的查询系统增强了搜索灵活性。
是一个高质量质谱数据库,包含32,330种化合物和超过1600万个质谱数据,数据来源于ThermoFisher质谱仪,质量高,每周更新。支持多种搜索方式。
3.5. 生物信息学与分子设计研究中心天然产物质谱库
BMDMS-NP是一个综合性免费ESI-MS/MS谱图库,包含2739种对照品和288,939个MS/MS谱图,数据经过降噪处理,提供灵活的搜索选项。
SMSD是一个专注于皂苷类化合物的开放获取数据库,包含4196种皂苷,提供分类、搜索和代谢物查询功能。
是一个综合性植物代谢组学数据库,包含188,938种化合物和279,750个高分辨率MS/MS谱图,整合了基因组、转录组、化学反应和代谢通路等信息,支持批量任务提交。
4. 中药质谱数据库存在的问题
数据覆盖范围有限,实验条件波动导致数据稳定性差,不同仪器和数据库的标准与方法不统一,影响了数据的可比性、可靠性和可重复性。需通过标准化流程、数据融合技术及信号处理算法提升数据质量。
相较于mzCloud等数据库的每周更新,许多中药质谱数据库更新周期缓慢。数据来源依赖文献和实验,收集整理耗时;商业数据库更新成本高且用户需求不强烈是主要原因。
部分数据库不支持常见质谱数据格式,需转换;搜索功能单一,缺乏高级检索(如结构搜索、多条件搜索);批量搜索功能不完善,难以满足高通量鉴定需求。
由于知识产权和数据安全考虑,许多商业数据库限制数据共享,阻碍了数据交流与合作。数据库安全措施可能存在漏洞,导致数据被访问、篡改或滥用。
5. 讨论与展望
中药质谱数据库的发展显著推动了中药研究的现代化。未来,需要在技术层面持续整合先进匹配算法和评分函数,提升检索精度和效率。构建一个开放、全面、精准的中药质谱数据库,促进数据共享生态系统的形成至关重要。持续扩张数据库规模,并探索创新功能模块,如集成人工智能和机器学习等前沿技术,以增强数据处理和分析能力。同时,确保数据安全和隐私保护仍是重中之重。例如,mWISE、MolDiscovery、MassFormer等计算工具和预测模型为化合物注释提供了有力补充,但其适用范围和精度仍有提升空间。借鉴GNPS通过众包扩展谱库和PMhub 1.0整合CFM-ID模拟MS/MS谱图的低成本策略,是未来数据库建设值得考虑的方向。
6. 结论
质谱数据库在中药和天然产物成分的高效鉴定方面展现出巨大潜力。本文综述的14个代表性数据库各有特点,但也共同面临着数据标准化、用户界面不友好、检索功能有限和数据共享不足等挑战。解决这些问题,推动开放、全面的中药质谱数据库的建设,将极大促进中药化学成分研究、代谢组学发展及药物研发等领域的进步。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号