基于不同提取溶剂所得的融合表面增强拉曼光谱(fused surface enhanced Raman spectra)对绿茶品种和产地的鉴定

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Identification of green tea varieties and origins based on fused surface enhanced Raman spectra from different extraction solvent

【字体: 时间:2025年11月19日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  本研究针对绿茶市场掺假和产地欺诈问题,通过融合不同溶剂提取的SERS光谱,结合多种降维技术和分类模型,有效识别了七种绿茶品种及产地,其中UMAP-SVM组合准确率达98.21%,为绿茶质量监控提供新方法。

  本研究针对市场上绿色茶叶品种掺杂和产地欺诈的问题,提出了一种基于融合表面增强拉曼散射(SERS)光谱的分类方法。该方法通过使用三种不同的提取溶剂(水、乙醇和盐酸)获取单个SERS光谱,并将其融合以提高分类能力。在融合SERS数据的基础上,应用了多种降维技术,包括竞争自适应重加权采样(CARS)、主成分分析(PCA)、t分布随机邻域嵌入(t-SNE)和均匀流形近似与投影(UMAP),以降低数据维度并增强模型的判别能力。最终,采用支持向量机(SVM)、K近邻(KNN)和随机森林(RF)算法构建分类模型,其中UMAP-SVM策略在七种绿色茶叶品种的分类中表现出最佳性能,准确率达到98.21%。此外,对于碧螺春和龙井两种茶叶的产地识别,准确率分别达到了98.61%和97.22%。该研究建立了一种简单、环保、快速的绿色茶叶品种和产地识别方法,为绿色茶叶质量监测提供了新的研究思路。

绿色茶叶作为一种未发酵的饮品,在东亚和东南亚地区,尤其是中国、日本、韩国和越南,具有深远的文化意义和广泛的实际应用。其不仅作为日常饮品受到人们的喜爱,还因其富含的生物活性成分而被广泛应用于医药领域。研究表明,茶叶中的多酚类化合物和甲基黄嘌呤是其主要的活性成分,这些成分对人体健康有诸多益处,如促进伤口愈合、改善血糖控制、优化消化系统功能以及维持代谢平衡。然而,随着绿色茶叶市场的发展,品种掺杂和产地欺诈等问题也日益严重。这些问题不仅损害了消费者的权益,也影响了供应链的稳定性。因此,建立一种高效、准确、便捷的分析方法,以识别绿色茶叶的品种和产地,显得尤为重要。

目前,已有多种分析技术被用于绿色茶叶的品种和产地识别,包括高效液相色谱(HPLC)、气相色谱-质谱联用(GC–MS)、电感耦合等离子体质谱(ICP–MS)、比色法、荧光法、傅里叶变换红外光谱(FTIR)以及核磁共振(NMR)光谱。尽管这些传统方法在识别绿色茶叶方面具有一定的可靠性,但它们通常需要复杂的实验步骤、繁琐的样品预处理过程、专业的操作人员以及较长的分析时间。因此,开发一种简便、快速、低成本且环保的识别方法,成为当前研究的重点。

表面增强拉曼散射(SERS)技术因其高灵敏度、分子指纹特异性、现场检测能力和对水分干扰的微弱性,成为食品识别领域的一种有前景的分析方法。SERS通过分子与金属纳米结构表面的相互作用,实现对痕量物质的特异性检测。近年来,SERS技术已被广泛应用于农产品、中药材和食品的质量监测中。例如,Guoyu Dai等人通过研究SERS信号强度与陈皮储存时间之间的反比关系,结合主成分分析-线性判别分析(PCA-LDA)算法,成功区分了1至30年不等的陈皮样品。Chima Robert等人将SERS与化学计量建模相结合,实现了牛肉、鹿肉和羊肉的快速鉴别。Akshata Hegde等人则开发了SERSFormer 2.0框架,将SERS与Transformer架构相结合,能够同时实现多种农药残留的识别和定量分析。Xueqing Wang等人基于银纳米颗粒建立了SERS光谱指纹,并利用一维卷积神经网络(1D-CNN)进行多参数分析,包括产品分类、产地追踪、质量分级和掺杂物质检测。Fan Li等人通过将多维SERS与PCA-LDA算法结合,实现了茶叶品种、产地和质量等级的区分,展示了其在食品认证中的巨大潜力。

综上所述,由于SERS技术结合了荧光光谱的高信号强度和窄光谱峰以及近红外光谱的分子指纹信息,使其在天然产物识别方面具有独特的优势。然而,SERS技术在物质检测过程中缺乏选择性,容易导致信号同质化的问题。为了解决这一问题,融合SERS光谱被证明是一种有效的策略。例如,Fan等人通过基于多种基底的多维SERS指纹分析,展示了该策略在食品真实性鉴定中的可行性。但这种方法仍面临挑战,主要是由于SERS对干扰信号(如样品基质、背景荧光和多基底)的敏感性,这些干扰因素在识别天然产物时会产生无序的光谱峰信息,尤其是在融合SERS数据的情况下。因此,考虑融合SERS光谱能够进一步增加光谱信息内容并增强样品之间的差异,而化学计量学方法则可以通过解析和降维等手段消除干扰信号,从而提出了新的策略,即SERS数据的维度扩展与降维处理。

本研究采用了一种结合单一基底与多种提取方法的策略,构建了融合SERS光谱数据,进而用于七种绿色茶叶品种的识别。如图1所示,选择了七种常见的绿色茶叶品种(西湖龙井、碧螺春、金山翠芽、黄山毛峰、梅潭翠芽、都匀毛尖和三江春茶),并分别用水、乙醇和盐酸三种溶剂进行提取,收集其SERS光谱数据。随后,通过五种不同的融合方法(矩阵拼接、CARS特征选择融合、PCA融合、t-SNE融合和UMAP融合),将单个SERS光谱数据整合为融合SERS光谱数据。最终,采用SVM、KNN和RF算法构建分类模型,用于识别绿色茶叶的品种和产地。通过对不同融合与建模技术组合的比较和分析,进一步优化了识别效果。

在实验样本部分,本研究选择了七种常见的绿色茶叶品种,并收集了每种品种的十个代表性品牌样本。所有样品均在避光条件下密封保存,并储存在4°C的环境中,以确保其在实验过程中的稳定性。所选茶叶样品代表了市场上常见的品种,根据其宏观特征被分为三个形态相似的组别:条形组(包括三江春茶和都匀毛尖)、卷曲组(包括黄山毛峰)等。通过对这些样本的系统研究,能够更全面地了解不同品种茶叶的化学组成和光谱特征,从而为后续的分类建模提供可靠的数据支持。

在SERS光谱表征部分,研究发现,使用相同提取溶剂获得的不同绿色茶叶品种的SERS光谱整体轮廓和核心特征峰分布表现出高度的一致性,这反映了绿色茶叶品种之间共有的化学成分。这种共性主要来源于茶叶中普遍存在的核心成分,如咖啡因、茶多酚、氨基酸和糖类。例如,糖类的特征峰通常出现在570 cm?1处,咖啡因的特征峰则多见于647 cm?1,茶多酚的特征峰则位于776 cm?1附近。然而,尽管这些核心成分在不同品种之间具有一定的相似性,但不同品种的茶叶在这些特征峰的强度和分布上仍存在差异,这些差异可以作为区分不同品种的重要依据。因此,通过融合不同提取溶剂获得的SERS光谱数据,能够进一步放大这些差异,提高分类模型的识别能力。

在本研究中,融合SERS数据的构建是关键步骤。通过对三种提取溶剂(水、乙醇和盐酸)下获得的SERS光谱进行融合,可以有效整合不同提取条件下茶叶化学成分的特征信息。融合后的数据不仅保留了原始光谱的丰富信息,还通过降维技术去除了冗余和干扰,从而提升了模型的判别能力。在实际应用中,这种融合策略能够克服单一提取溶剂下可能存在的信号限制,提高识别的全面性和准确性。

在建模过程中,采用了多种机器学习算法进行分类。其中,单溶剂模型中,水作为提取溶剂与随机森林(RF)分类算法结合,取得了79.17%的最高准确率。这表明,在单一溶剂提取条件下,RF算法能够有效识别茶叶品种。然而,随着融合SERS数据的引入,模型的识别能力得到了显著提升。其中,UMAP-SVM策略在七种茶叶品种的分类中表现出最佳性能,准确率达到98.21%。这说明,通过融合不同提取条件下的SERS数据,并结合适当的降维和建模技术,可以显著提高茶叶品种识别的准确性。此外,在产地识别方面,碧螺春和龙井的准确率分别达到了98.61%和97.22%,进一步验证了该方法在茶叶产地溯源方面的有效性。

本研究的结果表明,融合SERS光谱数据结合机器学习技术,能够实现对绿色茶叶品种和产地的高效识别。这种方法不仅简化了传统分析方法的复杂流程,还降低了实验成本和时间,具有较强的实用性和推广价值。此外,由于SERS技术本身具有非破坏性、快速检测和环保等优点,使得该方法在实际应用中更加便捷。未来,该方法有望被广泛应用于茶叶质量监测、市场监管和供应链管理等领域,为绿色茶叶的可持续发展提供技术支持。

通过本研究的探索,我们发现融合SERS数据在提升茶叶品种和产地识别能力方面具有显著优势。融合后的数据不仅能够保留更多化学成分的特征信息,还通过降维技术去除了干扰因素,使得模型的训练更加高效和准确。此外,不同提取溶剂的组合能够揭示茶叶在不同化学环境下的响应特性,从而增强模型的泛化能力。这种融合策略的引入,为解决传统方法在茶叶识别中的局限性提供了新的思路。

在实际应用中,该方法的优势在于其操作简便性和结果的可重复性。通过使用三种不同的提取溶剂,可以更全面地获取茶叶的化学信息,而融合后的数据则能够更清晰地反映这些信息的差异。同时,该方法无需复杂的样品预处理过程,减少了实验的步骤和时间,提高了检测效率。此外,由于SERS技术本身对水分的干扰较小,使得该方法在湿度较高的环境中仍能保持较高的识别准确率,这在实际市场检测中具有重要意义。

在构建分类模型时,SVM、KNN和RF等算法各具特点。其中,SVM在处理高维数据和小样本数据方面表现出色,适用于茶叶品种的分类。KNN算法则依赖于样本之间的相似性,适用于数据分布较为均匀的情况。而RF算法通过集成多个决策树,能够有效降低模型的过拟合风险,提高分类的稳定性。在本研究中,不同融合方法与建模技术的组合被系统地比较和分析,以确定最佳的识别策略。例如,UMAP作为降维技术,在提取关键特征的同时保持了数据的全局结构,使得SVM算法能够更准确地分类茶叶品种和产地。

此外,本研究还强调了SERS技术在食品检测中的应用前景。由于其高灵敏度和分子指纹特异性,SERS技术能够检测到微量的化学成分,这对于识别茶叶中的微量掺杂物质具有重要意义。同时,SERS技术的现场检测能力使其适用于快速、便携的检测设备,能够满足市场对即时检测的需求。因此,结合SERS技术与机器学习算法,不仅能够提高茶叶识别的准确率,还能够推动检测技术向智能化、自动化方向发展。

在本研究中,所采用的实验方法和数据处理流程体现了科学性和严谨性。通过对不同提取溶剂下获得的SERS光谱进行系统分析,能够全面了解茶叶在不同化学条件下的响应特性。同时,通过融合策略和降维技术的结合,能够有效提高模型的识别能力,减少干扰因素的影响。这种多步骤的数据处理流程不仅保证了实验的可靠性,还为后续的模型优化和应用提供了坚实的基础。

本研究的成果不仅为绿色茶叶的质量监测提供了新的技术手段,还为相关领域的研究提供了重要的参考。通过融合SERS数据和机器学习算法,能够实现对茶叶品种和产地的高效识别,为打击市场欺诈、保障消费者权益和维护供应链安全提供了科学依据。此外,该方法的简便性和环保性,使其在实际应用中更具优势,特别是在需要快速检测和现场分析的场景中。

综上所述,本研究通过融合SERS光谱数据并结合机器学习算法,成功构建了一种用于绿色茶叶品种和产地识别的方法。该方法在识别准确率、检测效率和环保性方面均表现出色,为茶叶质量监测和市场监管提供了新的思路。未来,随着SERS技术和机器学习算法的不断发展,该方法有望在更多领域得到应用,为食品安全和质量控制提供更加可靠的解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号