结合快速蒸发电离质谱技术和化学计量学方法以区分可可豆的质量
《Current Research in Food Science》:Combining Rapid Evaporative Ionization Mass Spectrometry and Chemometrics for the Differentiation of Cocoa Bean Quality
【字体:
大
中
小
】
时间:2025年08月07日
来源:Current Research in Food Science 7
编辑推荐:
本研究利用快速蒸发电离质谱(REIMS)结合化学计量学,分析了21种功能性微生物(抗真菌/pectinolytic)发酵可可豆的代谢指纹差异,并优化了随机森林等机器学习模型。结果显示,随机森林模型在独立数据集上对功能性发酵豆(AF/P)与普通对照(Control)的区分准确率达85%,但对多类别的区分存在过拟合问题。代谢指纹分析表明,m/z 181.070、255.232等离子特征与微生物功能显著相关,但环境因素(如年份、产地)可能影响模型泛化能力。研究为可可豆功能性发酵的快速筛选提供了技术支持。
本研究探讨了如何利用快速蒸发离子化质谱(REIMS)结合化学计量学方法,对使用特定功能微生物菌群发酵的可可豆进行快速区分。这一方法旨在提高可可豆的质量一致性,减少对微生物菌群筛选过程的时间消耗和复杂性。可可豆作为巧克力的主要成分,其全球产量在2021-2022年达到了约490万吨,总贸易额超过95亿美元,显示出其在食品供应链中的重要性。发酵是可可豆加工的第一步,对最终产品质量起着决定性作用。然而,目前农民主要依靠经验进行发酵,导致产品质量不稳定。功能微生物菌群被认为是提升产品质量和安全性的有效手段,但其开发过程往往耗时较长。
在发酵过程中,非期望微生物的污染是一个关键问题,这些微生物可能影响可可豆的质量,引发内部霉变、异味、游离脂肪酸水平升高以及霉菌毒素的产生。其中,丝状真菌因其能产生致癌性霉菌毒素如赭曲霉毒素A和黄曲霉毒素而特别值得关注。污染可能发生在发酵、干燥、储存和运输的各个阶段。为了减少这些风险,功能微生物菌群被积极研究。例如,一项研究在玻利维亚和巴西的农场发酵中筛选出四种乳酸菌-酵母共生菌群,成功抑制了Aspergillus flavus S075的生长,显示出目标微生物选择在提升可可发酵安全性方面的潜力。
除了控制污染,微生物菌群还被用于其他功能,如加速发酵和增强风味发展。例如,使用Lactobacillus fermentum 223和Saccharomyces cerevisiae H290进行发酵的可可豆,其口感更佳,异味减少,风味更浓郁。同样,结合Wickerhamomyces pijperi的pectinolytic菌株与上述菌株,也在哥斯达黎加的农场应用中成功加速了发酵过程。这些微生物干预影响了可可豆的理化特性,有助于形成理想的品质属性。为了评估其影响,一些研究采用目标分析方法,量化功能微生物发酵与自然发酵可可豆中的特定化合物含量。然而,这些方法往往耗时且吞吐量有限。因此,REIMS作为一种非目标代谢物指纹分析工具,因其快速筛查和区分发酵结果的能力,被认为是更可扩展的替代方案。
REIMS是一种环境质谱系统,能够以最小的样品预处理实现实时的非目标代谢物指纹采集。这些指纹由质量电荷比(m/z)和相对强度定义,可借助化学计量学技术进行分析,以识别模式、区分样本和预测品质属性。自2015年引入食品行业以来,REIMS在肉类和鱼类产品中得到了广泛应用,因其丰富的脂质化学特征。然而,其在乳制品和植物基产品中的应用仍相对有限。REIMS已被用于食品真实性鉴定、欺诈检测、品质区分和代谢组学表征。例如,REIMS成功鉴别了来自九种来源的可可和巧克力,准确率超过98%;鉴别了来自五种来源的开心果,准确率为100%;以及鉴别了来自七个意大利地区的橄榄油,准确率超过95%。此外,REIMS还被用于蜂蜜、可可脂和多种油脂的掺假检测,准确率超过90%;用于区分咖啡粉的感官品质,准确率超过87%。在发酵食品的背景下,Murphy等人展示了REIMS结合化学计量学可区分不同微生物菌群发酵的牛奶。然而,利用REIMS区分发酵产品基于微生物菌群的特定功能,如抗真菌或果胶分解活性,仍然鲜有研究。
本研究采用REIMS结合化学计量学分析,以区分使用功能微生物菌群发酵的可可豆。选择的微生物菌株在实验室规模下进行发酵,然后使用REIMS分析生成非目标代谢物指纹。初步区分使用了LiveID软件,该软件与REIMS系统集成,应用主成分分析(PCA)和线性判别分析(LDA)。为进一步提高分类性能,评估了六种其他机器学习算法。其中,随机森林(RF)表现出色,被进一步优化和测试,以使用独立的代谢物指纹数据集,以推广该方法用于根据功能分类可可豆。
实验中使用了六种具有已知抗真菌和/或果胶分解活性的菌株,作为单菌种和共培养进行发酵。菌株均来自ZHAW食品生物技术研究组的菌种库。发酵前,菌株的质量通过MALDI-TOF MS确认,其抗真菌和果胶分解活性也由Martos等人和Romanens等人报告。每个菌株在改良的可可豆模拟培养基(mCPSM)中培养过夜,培养条件为30°C。在实验室条件下,发酵试验使用厄瓜多尔可可豆进行,样本量为220克新鲜豆子,允许同时筛查22种变异。首先,将豆子从豆荚中提取、均质化并冷冻至-20°C,直到实验进行。在每次实验前,样本被解冻并均匀分布在有穿孔底部的花盆中,以收集发酵过程中流出的果肉。新鲜的果肉-豆子混合物被接种预定的功能微生物菌群,接种浓度分别为10^6 CFU/g(LAB菌株N°1到3和9到21)、10^3 CFU/g(单菌种酵母菌株N°4到8)和10^2 CFU/g(酵母-LAB共培养N°9到21)。负对照(N°22)未接种任何微生物菌群。在接种后,20克果肉-豆子混合物被采样以确认接种水平和抗真菌活性(补充材料)。发酵和干燥后,豆子被冷冻过夜至-80°C。然后,使用咖啡磨将冷冻豆子磨成粉末,储存至-80°C直至进一步分析。
发酵试验在三组重复中进行,使用2022年5月购买的豆子构建数据模型。为了验证模型,N°9到13和N°18到21,以及负对照(N°22)在2023年5月独立重复,作为外部测试数据集。在第二阶段,研究了各种机器学习模型在使用第一组三重复的代谢物指纹数据上对可可豆分类性能的评估。数据通过MassLynx软件从REIMS中获取,然后使用LiveID软件进行初步分析。因此,数据被预处理,包括峰检测、质谱绑定、背景去除、锁质量校正和基于总离子强度(TIC)的质谱归一化。随后,对整个m/z范围进行了无监督的主成分分析(PCA),接着在PCA基础上应用了监督的线性判别分析(PCA-LDA)。最后,使用软件的“留出20%”方法验证PCA-LDA模型,即用80%的数据集构建模型,用剩余的20%进行测试。
在第二阶段,研究了常见用于REIMS化学计量学的机器学习模型在功能微生物共培养发酵的可可豆上的性能。数据从MassLynx中提取后,使用LeuEnk(554.2615 m/z)进行锁质量校正,并通过RStudio处理。数据集首先以0.001为单位进行分箱和预处理。在离子峰根据TIC归一化后,通过选择相对强度等于或高于2e-3%的变量去除背景。接着,使用corrplot包移除高度相关的峰(>0.95)。随后,定义了三个类别:“AF”包括使用AF功能微生物共培养发酵的可可豆(N°9到12),“AF&P”包括使用AF&P功能微生物共培养发酵的可可豆(N°14到21),以及“控制”包括控制豆子(N°13和22)。数据集被随机分为两个部分,80%用于训练模型,20%用于测试模型。构建了六种模型:(1)梯度提升机(GBM),(2)k-最近邻(KNN),(3)朴素贝叶斯,(4)神经网络(NNET),(5)随机森林(RF),以及(6)支持向量机(SVM)。使用caret包的train函数(Kuhn & Max, 2008)以默认参数构建模型,并通过五折交叉验证进行验证。模型在不同数据分割下运行了10次,计算了模型的性能指标,包括准确率、精确率和召回率。然后,使用dplyr和tidyr包通过ANOVA比较模型的性能指标。当ANOVA显示模型间存在显著差异(p值<0.005)时,使用agricolae包进行事后Tukey检验。最后,通过randomForest包优化和训练RF模型,并使用第四组数据集测试模型以评估其泛化能力。通过调整类别的权重和使用tuneRF函数确定最优的mtry值,进行模型训练。训练模型后,使用第四组数据集测试模型并评估其泛化能力。对于每个模型,通过交叉验证获得的准确率以及在测试数据集上的准确率、预测和召回率用于估计模型性能。使用caret包的importance函数确定变量的平均准确率下降(MDA),以评估离子在构建模型中的重要性。MDA最高的前10个离子使用ggplot2表示。随后,通过ANOVA比较这些离子在不同类别的平均相对含量,并用Tukey检验表示。
实验结果表明,REIMS结合化学计量学能够有效区分使用功能微生物菌群发酵的可可豆。通过REIMS获得的代谢物指纹显示出高丰度的化合物,特别是在m/z 100到500的范围内。然而,在比较使用微生物菌群N°1到N°21和负对照(N°22)的代谢物指纹时,未观察到明显的视觉差异。在使用LiveID软件构建的PCA-LDA模型中,单菌种发酵的可可豆能够根据其微生物菌群进行区分。在第一个线性判别(LD1)上,该模型能够区分使用酵母和LAB菌群发酵的可可豆。模型区分了不同菌株的可可豆,除了使用抗真菌LAB菌群Lb. fermentum 223和M017,它们在图中特别接近,表明它们的化学指纹相似。使用非抗真菌LAB菌群Lb. fermentum 193的可可豆在图中更远,表明其化学指纹更具区分性。
在功能微生物共培养的区分方面,REIMS代谢物指纹能够根据预期的功能活性区分可可豆。这包括使用AF(抗真菌)微生物共培养(N°9到12)、AF&P(抗真菌与果胶分解)微生物共培养(N°14到21)以及控制样本(N°13和22)。同样,这些模型使用LiveID软件构建。无监督的PCA模型未能清晰地根据微生物共培养的功能性(如AF和AF&P)将可可豆聚类。然而,监督的PCA-LDA模型显示出更大的潜力来根据功能活性区分可可豆。控制样本的代谢物指纹与使用功能微生物共培养的样本不同,这在第一个线性判别(LD1)上明显。区分使用AF微生物共培养和AF&P微生物共培养的样本出现在第二个线性判别(LD2)上。然而,这些组之间有轻微重叠,表明它们的化学特征存在相似性。模型的准确率为80%。正如预期的那样,区分使用AF微生物共培养和AF&P微生物共培养的样本是模型的主要错误来源。预测使用AF微生物共培养的可可豆的精确率为70%,而预测使用AF&P微生物共培养的样本的精确率为81%。27%的可可豆被预测为使用AF微生物共培养,但实际来源于使用AF&P微生物共培养的样本;15%的可可豆被预测为使用AF&P微生物共培养,但实际来源于使用AF微生物共培养的样本。
为了提高区分能力,研究评估了六种机器学习模型(GBM、KNN、朴素贝叶斯、NNET、RF和SVM)在根据微生物共培养的功能活性分类可可豆代谢物指纹中的准确率。三个类别被定义:AF,包括使用AF功能微生物共培养发酵的可可豆(N°9到12);AF&P,包括使用AF&P功能微生物共培养发酵的可可豆(N°14到21);以及控制,包括控制样本(N°13和22)。三类模型(a)被训练以分类三种类型的可可豆,使用AF类、AF&P类和控制类。GBM、RF和NNET在使用其代谢物指纹预测可可豆类型方面表现显著更好,准确率分别为85%、84%和81%。相比之下,朴素贝叶斯的平均准确率较低,为68%。性能分析显示,这六种模型在分类控制类样本方面能力有限。召回率从GBM模型的73%到朴素贝叶斯模型的11%不等,表明模型在识别控制类样本时存在困难。
在(b)模型中,区分AF类和控制类的样本,GBM、RF和NNET模型表现出色,准确率分别为86%、85%和82%。这些模型在AF类样本的预测精确率分别为90%、85%和85%。在控制类样本的预测精确率分别为85%、86%和82%。此外,它们在AF类样本的召回率分别为80%、66%和67%。相比之下,KNN和朴素贝叶斯的准确率较低,分别为73%和68%。
在(c)模型中,区分AF&P类和控制类的样本,RF、GBM、SVM和NNET模型达到了最高的准确率,分别为91%、87%、87%和86%。如三类模型所示,朴素贝叶斯的表现较差,准确率为73%。在该分类中,控制类样本的召回率普遍较低,尤其是朴素贝叶斯模型的召回率仅为29%,表明这些模型在识别控制类样本时存在困难。
在(d)模型中,区分AF类和AF&P类的样本,六种模型的准确率从82%(朴素贝叶斯)到94%(RF)不等。然而,朴素贝叶斯的准确率显著较低。这些发现表明,两分类模型在区分两种品质类别时表现优于多分类模型,这与Cardoso等人(42)的研究结果一致,他们报告称模型准确率与分类任务中包含的类别数量呈负相关。
选择最佳性能模型后,可以尝试在独立数据集上测试其预测结果,以评估模型的泛化潜力。为此,将RF模型应用于独立数据集。虽然该模型在交叉验证中表现优异,但其预测准确率在独立样本上有所下降,表明存在一定程度的过拟合。这一结果并不意外,突显了模型泛化过程中常见的限制。值得注意的是,尽管许多REIMS研究报告了交叉验证结果,但很少有研究尝试在独立数据集上验证模型,尽管这一步对实际应用至关重要。一些涉及植物基产品的REIMS研究已经使用独立样本测试模型泛化。例如,使用103种单花蜂蜜的代谢物指纹实现了96%的准确率;使用62种初榨油和276种高粱样本构建的模型在原产地鉴定中分别达到了100%和88-97%的准确率。这表明样本数量和特征优化对于构建稳健、可泛化的REIMS分类模型至关重要。
此外,通过减少特征维度(即离子)来改进特征选择,可能进一步支持模型泛化。Gredell等人(77)展示了应用适当降维技术可以提高各种机器学习模型在预测牛肉品质中的性能。这些发现表明,样本数量和特征优化对于构建稳健、可泛化的REIMS分类模型至关重要。因此,研究模型构建中重要的变量,有助于更好地理解哪些离子能够区分使用功能微生物菌群发酵的可可豆。
在优化的RF模型中,最重要的变量被识别并比较了不同分类任务。这种分析超出了预期,因为它使我们能够识别出不同可可豆类型的特征离子,特别是那些使用AF、AF&P微生物共培养和控制发酵的样本。这些关键离子主要位于质谱的低质量电荷比(m/z)范围内(100-500 m/z),通常称为脂肪酸区域。有趣的是,这与Chang等人(46)的研究结果不同,他们报告称用于区分可可脂和掺假可可脂的化学标记位于500 m/z以上。我们研究中识别出的一些重要离子也在文献中被报道,并且可能被初步鉴定。例如,255.232 m/z的离子,对于分类AF和AF&P样本最为关键,被鉴定为棕榈酸。同样,位于AF微生物共培养发酵可可豆中的279.232 m/z和281.248 m/z的离子被鉴定为亚油酸和油酸。这些脂肪酸是可可豆中已知的主要脂肪酸。
这些发现表明,功能微生物菌群可能影响可可豆的脂肪酸组成。进一步研究使用功能菌群发酵的可可豆与自然发酵的可可豆的脂肪酸谱,可能提供关于微生物干预生化影响的更深入见解。此外,RF模型中重要的离子在受控实验室环境中已被证明有效,但在更大规模的农场发酵过程中,其可靠性和相关性需要重新评估,因为环境变量和操作复杂性引入了新的限制。
为了在农场环境中验证REIMS的潜力,需要进行更大规模的实验。本研究中使用的两种抗真菌共培养已经在洪都拉斯和哥斯达黎加的农场应用,其对发酵动态、目标化学成分和感官特性的影响在Romanens等人(13)和Freimüller等人(14)的研究中有所描述。然而,REIMS区分农场发酵的可可豆基于所用微生物菌群的功能性仍需验证。广泛的农场应用功能微生物菌群将有助于构建基于REIMS的稳健分类模型。此外,测试农场发酵的豆子在训练数据集中的抗真菌特性,可以补充模型性能评估。
迄今为止,只有少数研究尝试在农场条件下展示功能微生物菌群的抗真菌效果。例如,Ngang等人(79)和Rahayu等人(80)在印度尼西亚应用了基于LAB-酵母和/或AAB的抗真菌菌群,引入了产生OTA的霉菌。尽管这些研究报告了成功抑制霉菌生长和OTA生产,但进一步确认其可行性仍是必要的。最近,Kadjo等人(81)在科特迪瓦多的农场研究中调查了Bacillus thuringiensis菌株作为抗真菌菌群的效果,报告称在发酵和干燥过程中完全抑制了真菌生长。正如之前提到的,Romanens等人(13)和Freimüller等人(14)成功应用了LAB-酵母共培养,证明了其在实验室条件下的抗真菌活性。然而,这些特定菌群在农场条件下的抗真菌效果仍需确认,以支持其在基于REIMS的分类模型中的应用。
在农场环境中实施REIMS需要进一步考虑。区分使用功能微生物菌群发酵的可可豆可能会受到环境因素的影响,包括豆子的来源、本地微生物群落、天气状况和季节变化。这些因素可能比微生物菌群本身对代谢物指纹产生更大的影响,引入更大的变异性,使分类变得更加困难。为了确保模型的精确度,可能需要控制或考虑豆子的来源和品种。总之,本研究展示了REIMS结合化学计量学作为快速、非目标工具的潜力,用于根据微生物菌群的功能性区分可可豆,为未来农场应用和功能起始菌群的加速开发奠定了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号