基于机器学习的电子鼻(E-nose)与电子眼(E-eye)融合技术,用于区分不同地理来源的菊花(Chrysanthemum morifolium)
《LWT》:Machine learning-based fusion of E-nose and E-eye for discrimination of chrysanthemum (
Chrysanthemum morifolium) from different geographical origins
【字体:
大
中
小
】
时间:2025年10月28日
来源:LWT 6.0
编辑推荐:
菊花不同地理原产地的鉴别基于电子眼(E-eye)和电子鼻(E-nose)多传感器数据融合技术,结合主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)和集成学习(XGBoost)模型。研究发现,仅使用单一传感器(E-eye或E-nose)的识别准确率不足,而低级融合(818个变量)和中级融合(10个变量)显著提升模型性能,其中中级融合结合XGBoost在测试集达到94%的准确率,证实多源数据融合与机器学习结合的有效性,为地理标志产品认证和质量控制提供新方法。
在中国,菊花作为一种传统药材、食品添加剂和花草茶,具有重要的文化和经济价值。它在国内外广泛使用,但其地理来源的鉴定一直是个挑战。菊花的种类通常根据其地理起源进行划分,如“亳菊”(BZJ)、“滁菊”(CZJ)、“杭菊”(HZJ)、“怀菊”(HJ)和“黄菊”(HSJ)。这些菊花品种在植物化学成分和药理特性上存在显著差异,例如“亳菊”因其对黄嘌呤氧化酶的抑制作用而受到关注,同时富含单萜类化合物和黄酮苷类物质;而“杭菊”则以其富含芦丁和阿魏酸-7-O-葡萄糖苷而著称,这些成分可能对痛风治疗具有积极作用。然而,由于不同地区的菊花在外观、颜色和香气上往往相似,传统的视觉和嗅觉鉴定方法难以满足现代市场对快速、可靠和低成本的鉴定需求。
近年来,随着科技的发展,许多分析技术被应用于菊花地理来源的鉴定,例如自动化热脱附-气相色谱-质谱联用技术(ATD-GC-MS)结合聚类分析,已被成功用于分类不同类型的菊花。此外,高效液相色谱-质谱联用技术(LC-MS)也用于区分来自九个产区的菊花样本。傅里叶变换红外光谱(FTIR)技术也被证明在区分菊花地理来源方面具有有效性。尽管这些技术能够提供较高的准确性,但它们通常依赖复杂的样品预处理、化学试剂和高成本的实验操作,限制了其在实际应用中的推广。
因此,研究者开始关注基于仿生传感器的非破坏性检测方法,如电子鼻(E-nose)、电子眼(E-eye)和电子舌(E-tongue)。这些传感器系统能够模拟人类的感官功能,实现对产品质量的快速评估。电子鼻通过传感器阵列检测挥发性化合物,生成独特的信号模式,而电子眼则通过图像捕捉和分析,获取颜色、纹理和整体外观等信息。电子舌则通过检测样品的味觉特征来辅助分析。这些传感器的结合,能够提供更加全面的质量信息,提高地理来源鉴定的准确性。
本研究旨在探索电子鼻和电子眼技术结合机器学习算法,用于菊花地理来源的鉴定。通过采集不同地理来源的菊花样本,使用电子鼻和电子眼系统获取数据,并结合多种机器学习模型进行分析,研究者希望找到一种高效、准确且经济的鉴定方法。该方法不仅能够减少对传统化学分析的依赖,还能提升市场公平性和产品质量控制的水平。
在实验设计中,研究者从五个不同的地理区域收集了菊花样本,包括安徽亳州、滁州、浙江杭州、河南焦作和安徽黄山。这些样本涵盖了不同农场和加工方法,确保了数据的多样性和代表性。采集的样本首先经过视觉和嗅觉评估,以验证其质量的可靠性。最终,研究者获得了150个独立的菊花样本,用于后续的分析和建模。
电子眼系统用于采集菊花的颜色信息,通过定制的图像采集设备,获取了高分辨率的图像数据。图像采集过程中,研究者使用了固定的拍摄角度和距离,确保数据的一致性。随后,对图像进行了阈值分割,提取了R、G、B、H、S、V、L*、a*和b*等颜色变量。这些变量不仅反映了菊花的颜色特征,还为后续的多变量分析提供了基础。
电子鼻系统则用于采集菊花的香气信息,使用了10个金属氧化物传感器(MOS)来检测挥发性化合物。采集过程中,样品被放置在密闭的锥形瓶中,经过一段时间的平衡后,通过静态顶空技术进行测量。采集的数据包括传感器在不同时间点的响应值,经过预处理后,形成了一个包含150个样本、180个变量和10个传感器的三维数据矩阵。通过主成分分析(PCA)等多变量分析方法,研究者观察到了不同地理来源菊花样本之间的差异。
在分类模型的构建中,研究者采用了多种机器学习算法,包括偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)和极端梯度提升(XGBoost)。对于单一传感器的数据,PLS-DA模型在电子眼和电子鼻上的准确率分别为63%和75%。而SVM模型在电子眼和电子鼻上的准确率分别为71%和82%。XGBoost模型则表现更优,其在电子眼和电子鼻上的准确率分别达到了80%和86%。这些结果表明,基于电子鼻的模型在分类准确率上优于电子眼模型,说明香气差异在菊花地理来源鉴定中更为显著。
为了进一步提高分类的准确性,研究者采用了数据融合策略,将电子眼和电子鼻的数据进行整合。低级融合将电子眼的18个颜色变量与电子鼻的800个变量结合,形成了818个变量的数据集。经过PCA分析后,研究者发现不同地理来源的菊花样本在融合数据中表现出更大的差异,特别是在“怀菊”样本中,显示出明显的聚类趋势。然而,基于低级融合的PLS-DA和SVM模型准确率并未显著提升,而XGBoost模型在训练集和测试集上的准确率分别达到了93%和92%。这表明,低级融合在某些情况下能够有效提高分类的准确性。
中级融合则通过PCA将电子眼和电子鼻的数据分别降维至前五主成分,再进行融合,形成10个变量的数据集。基于中级融合的PLS-DA模型在训练集和测试集上的准确率分别为71%和70%,而SVM模型的准确率分别为84%和84%。XGBoost模型在中级融合下的准确率分别为96%和94%,显示出显著的提升。这表明,中级融合在数据降维和特征提取方面具有优势,能够有效提高模型的分类性能。
研究者还分析了不同模型中变量的重要性,发现电子鼻的主成分在分类过程中起到了关键作用。特别是PC2_E-nose、PC1_E-nose和PC5_E-nose,这些主成分在模型中贡献较大。这进一步证明了电子鼻在菊花地理来源鉴定中的重要性。相比之下,电子眼的变量在模型中的贡献较小,说明颜色特征在某些情况下不足以准确区分不同地理来源的菊花。
在讨论部分,研究者提到之前的研究中,使用激光诱导击穿光谱(LIBS)技术对菊花进行区分,发现不同菊花样本中元素浓度的异质分布。此外,ATD-GC-MS结合PCA和聚类分析也被用于成功鉴定三种菊花类型。HPLC-DAD-ESI/MS技术则揭示了不同产区菊花样本中主要化学成分的差异。这些研究结果为本研究提供了理论支持,说明菊花的化学成分差异确实存在,且可能对地理来源鉴定具有重要意义。
然而,本研究并未对这些化学成分的具体浓度及其在不同菊花类型中的分布进行深入测量,而是选择使用仿生传感器技术来替代传统的感官评估和复杂的化学分析。研究者认为,这种方法不仅能够减少对化学试剂的依赖,还能提高检测的效率和准确性。尽管如此,本研究中的一些局限性仍然存在,例如未考虑不同农业管理实践、采摘季节和加工方法对菊花成分的影响,这可能导致模型存在一定的偏差。此外,样本的多样性仍然有限,未能全面涵盖所有可能的菊花品种和来源。
综上所述,本研究通过结合电子鼻和电子眼技术,利用机器学习算法对菊花的地理来源进行了鉴定。结果显示,单一传感器的数据在分类准确率上存在一定的不足,而通过数据融合,特别是中级融合结合XGBoost模型,能够显著提高分类的准确性。研究者认为,这种方法为菊花地理来源的非破坏性、快速和可靠鉴定提供了新的技术基础,并具有在未来更大规模样本集中的应用潜力。未来的研究可以进一步扩大样本范围,考虑更多影响因素,以构建更加全面和准确的分类模型,从而更好地支持菊花产业的发展和质量控制。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号