肯德里克的质量缺陷过滤技术实现了对微量植物大麻素的高通量非靶向鉴定:迈向更高效的植物大麻素组学研究
《ACS Measurement Science Au》:Kendrick Mass Defect Filtering Enables High-Throughput Untargeted Annotation of Minor Phytocannabinoids: Toward Streamlined Phytocannabinomics
【字体:
大
中
小
】
时间:2025年10月24日
来源:ACS Measurement Science Au 9.0
编辑推荐:
大麻植物中次要生法醉素的未靶向质谱分析及KMD过滤策略研究,比较三种KMD过滤方法(过滤前、后及伪KMD)在HRMS数据中的性能,发现结合KMD过滤前后的策略在降低计算负担(数据量从6.0GB降至0.8GB)的同时保持高注释率(61种化合物),并揭示地理来源和生殖策略对化合物组成的影响,证实现有分类体系需整合次要成分。
### 植物大麻素的分类与分析挑战
植物大麻素是一类广泛存在于大麻植物(Cannabis sativa)中的生物活性化合物,具有重要的药理学意义。它们主要在植物的腺毛中合成,包括主要成分和越来越多的次要成分。尽管已有大量研究揭示了这些化合物的生物学功能,但其在非靶向高分辨率质谱(HRMS)数据集中的全面注释仍然是一个重要的分析挑战。植物大麻素结构上的相似性、较低的丰度以及复杂的植物基质使得传统的分析方法难以准确识别和量化这些化合物。因此,开发高效的非靶向分析方法变得尤为必要。
在本研究中,我们首次将基于肯德基质量缺陷(Kendrick Mass Defect, KMD)的过滤策略应用于植物大麻素的注释。KMD是一种用于识别化合物同系物的工具,能够通过分析分子质量与理论质量之间的差异,快速筛选出具有相似结构的化合物。我们采用Compound Discoverer软件平台,测试了三种不同的KMD过滤策略:在“化合物检测”工具之前进行KMD过滤、在“化合物检测”工具之后进行KMD过滤,以及基于“预期化合物”工具的伪KMD过滤。这些方法在注释范围、假阳性率、计算负担和灵活性方面进行了比较分析。
### 实验设计与方法
#### 1. 植物大麻素的命名规则
在本研究中,我们采用了统一的命名规则,以便于对不同结构的植物大麻素进行分类。主要的植物大麻素,如THC和CBD,保留其原始名称,而侧链长度不同的同系物则通过后缀进行区分。例如,丙基同系物被称为varinoids,其后缀为“-varin”(如THCV和CBDV)。其他常见的侧链长度,如丁基、己基和庚基,分别用“-butol”、“-hexol”和“-phorol”作为后缀。此外,某些化合物的甲基化修饰也被标记为“-M”,如O-甲基化的大麻二酚酸(CBDMA)。这一命名体系有助于在非靶向分析中快速识别和分类不同的植物大麻素。
#### 2. 化学试剂与标准品
为了确保实验的准确性,我们使用了多种化学试剂和标准品。分析级乙醇(96%)和LC-MS级乙腈、水以及甲酸是从Carlo Erba(米兰,意大利)购买的。纯度认证的标准品,如CBGA、CBDA、THCA、CBGVA、CBDVA、THCVA、CBCVA、CBCA和CBNA,均以1 mg/mL的甲醇溶液形式购得,来自Cerilliant(Sigma-Aldrich Merck,米兰,意大利)。此外,一些化合物如cis-THCA、CBDBA、THCBA、CBDHA和CBDPA是通过先前的合成获得的。
#### 3. 植物材料与样品制备
本研究涉及50个大麻植株的花样品,这些植株在意大利罗维戈的农业研究机构(CREA-CI)内种植,依据意大利法律授权用于科学研究。种子于2018年3月播种,花期结束于2018年11月。成熟的大麻花或单性植株的花被收集并进行干燥处理,以空气干燥或40°C的恒温烘干方式。每个样品的详细信息,包括植物材料、性别、干燥方法、栽培类型、主要大麻素、化学类型、预期用途、地理来源和原产地,记录在附表S1中。
样品的制备过程遵循德国药典(Pharmacopeia)中关于大麻花的提取方法。每2克植物材料被研磨成细粉,并在96%的乙醇中进行提取。具体而言,500毫克粉末被悬浮在20毫升乙醇中,搅拌15分钟。上清液被收集,剩余的残渣再进行两次额外的提取,每次使用12.5毫升乙醇。最终提取物被合并,并用96%的乙醇定容至50毫升。随后,1毫升提取液通过0.45微米的滤膜过滤,再取100微升进行稀释,最终定容至1毫升,形成10倍稀释的样品。
#### 4. 非靶向HRMS数据采集
所有样品通过Ultimate 3000 UHPLC系统进行色谱分离,该系统配备有真空脱气机、二元泵、恒温自动进样器和恒温柱温箱。系统通过加热电喷雾电离(HESI)源与Q-Exactive Orbitrap质谱仪连接。色谱和质谱参数按照先前描述设置,包括流动相的组成、电喷雾电压、离子源温度等。样品的分析以负离子模式进行,分辨率为70,000(以m/z 200的半高宽计算)。
#### 5. 植物大麻素的数据处理
在本研究中,我们使用Compound Discoverer 3.1软件对所有样品和空白对照进行预处理。测试了三种不同的数据处理策略:在“化合物检测”工具之前进行KMD过滤、在“化合物检测”工具之后进行KMD过滤,以及基于“预期化合物”工具的伪KMD过滤。每种方法在注释范围、假阳性率、计算负担和灵活性方面进行了比较。
KMD过滤是一种有效的工具,能够减少非靶向分析中的计算负担,同时提高注释效率。在“化合物检测”工具之前进行KMD过滤,可以显著缩小待处理的峰列表,从而减少后续分析的复杂性。然而,这种方法可能因KMD容忍度设置不当而过滤掉一些重要的化合物。相比之下,在“化合物检测”工具之后进行KMD过滤,虽然不减少计算负担,但能够保留更多的化合物信息,从而提高注释的全面性。伪KMD过滤方法通过“预期化合物”工具模拟KMD过滤的效果,能够生成潜在的化合物候选列表,但其计算负担较高,且与“填补空缺”工具不兼容,可能导致数据矩阵中出现零峰面积的情况。
### 结果与讨论
#### 1. KMD过滤策略的比较
通过比较三种KMD过滤策略,我们发现每种方法都有其独特的优势和局限性。在“化合物检测”工具之前进行KMD过滤能够显著减少计算负担和数据存储需求,适用于高通量分析。然而,这种方法的灵活性较低,一旦处理完成,被过滤掉的峰无法进行回溯分析。此外,该方法最多只能同时处理五个化合物类别,限制了其在复杂数据集中的应用。
相比之下,在“化合物检测”工具之后进行KMD过滤的方法虽然计算负担较大,但能够保留更多的化合物信息,从而提高注释的准确性。该方法的最大优势在于其较高的注释率,能够有效识别更多的植物大麻素。然而,这种方法未能减少计算负担和数据存储需求,可能对资源有限的实验室构成挑战。
伪KMD过滤方法通过“预期化合物”工具生成候选化合物列表,虽然能够模拟KMD过滤的效果,但其计算负担和数据存储需求较高。此外,该方法与“填补空缺”工具不兼容,导致部分低丰度化合物的峰面积被错误地设为零。尽管如此,伪KMD方法在探索未知化合物结构方面具有巨大潜力,尤其是在研究未报告的结构修饰时。
为了克服这些方法的局限性,我们测试了一种混合策略,即在“化合物检测”工具前后都进行KMD过滤。这种方法结合了前两种方法的优点,既减少了计算负担,又保持了较高的注释率。然而,该方法仍然缺乏灵活性,无法处理多种化合物类别。
#### 2. 植物大麻素的组成分析
通过非靶向HRMS分析,我们成功注释了61种植物大麻素,包括完整的烷基同系物(C1–C7)、顺/反异构体、O-甲基化衍生物以及三萜大麻素(sesquicannabinoids)。这些化合物的注释基于实验数据与标准品的保留时间(RT)、质谱(MS)和质谱/质谱(MS/MS)数据的匹配。通过分析这些化合物的保留时间、质谱碎片模式和质量缺陷,我们能够区分不同的同系物和异构体。
在地理来源方面,中国来源的样品表现出较高的O-甲基化大麻素含量,而欧洲来源的样品则在其他化合物的表达上更为均衡。这些结果表明,植物的地理来源可能对植物大麻素的组成产生显著影响。此外,O-甲基化大麻素可能成为植物地理来源的潜在标记物,无论其种植地点如何。
在化学类型方面,我们发现不同的化学类型对植物大麻素的表达存在显著差异。例如,THCA在化学类型I和II中最为丰富,而CBDA在化学类型II和III中占据主导地位。CBGA则主要在化学类型IV中出现。这些差异可能反映了不同化学类型在大麻素合成途径上的不同表达模式。
#### 3. 植物繁殖策略的影响
大麻通常被认为是雌雄异株植物,即每株植物要么是雄性,要么是雌性。雌性植物通常更受青睐,因为其花中大麻素的浓度较高,适合提取和消费。然而,一些单株植物(monoecious)同时具有雄性和雌性花,常用于工业用途,如种子大麻或纤维大麻。在本研究中,使用的单株植物样本均属于化学类型III和IV。
通过统计分析,我们发现雌性植株的大麻素含量显著高于单株植株。在单株植株中,THCA和CBDA的含量较高,而CBGA的含量则相对较低。这可能表明,不同繁殖策略对大麻素的合成途径存在差异,进而影响其表达水平。此外,我们还发现,某些低碳链的大麻素在单株植株中表现出更高的丰度,这可能与不同的酶活性有关。
#### 4. 未来展望
本研究首次系统评估了基于KMD的过滤策略在非靶向植物大麻素注释中的应用。通过使用Compound Discoverer软件平台,我们测试了三种不同的KMD过滤方法,并在注释范围、假阳性率、计算负担和灵活性方面进行了比较。KMD过滤不仅能够减少非靶向HRMS分析中的计算负担和数据复杂性,还能更有效地探索同系物家族的化学特征。
植物大麻素的注释结果表明,大麻的化学复杂性远超传统分类方法所能涵盖的范围。当前的分类系统通常仅基于主要的大麻素,而忽略了次要成分的重要性。因此,深入研究次要大麻素的表达模式有助于揭示更细致的化学异质性和生物合成机制。
展望未来,KMD过滤方法在非靶向分析中的应用不仅限于植物大麻素,还可能拓展到其他代谢物的分析,如脂质、多羟基化和多甲基化的黄酮类化合物、糖苷等。这些化合物通常具有重复的分子单元,KMD过滤能够帮助系统地识别和组织这些化合物。此外,未来的研究应进一步扩展已知和潜在的大麻素库,并结合更多的化学修饰反应,以提高注释的准确性和全面性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号