基于深度学习的超光谱成像中颜色与光谱特征的融合技术,用于识别丹参(Salvia miltiorrhiza)的来源

《Science of Traditional Chinese Medicine》:Deep learning-based fusion of color and spectral features from hyperspectral imaging for the origin identification of Salvia miltiorrhiza

【字体: 时间:2025年11月04日 来源:Science of Traditional Chinese Medicine

编辑推荐:

  本研究利用高光谱成像技术,结合多级数据融合策略(数据级、特征级、决策级),整合丹参的谱学数据与颜色信息,构建了基于Transformer模型和软投票集成的原产地分类模型,实现了98.72%的识别准确率,为丹参地理标志保护提供了非破坏性、高效的解决方案。

  在当今社会,随着人们对传统中医药的关注度不断提升,其市场需求也持续增长。然而,这种增长也带来了新的挑战,特别是如何确保中药材的真实性和可追溯性。以“丹参”(*Salvia miltiorrhiza* Bunge)为例,这种中药因其根部独特的红色而闻名,其化学成分中的丹参酮类化合物被认为是其主要的活性物质,不仅决定了其药效,也影响了其市场价值。然而,由于丹参种植区域广泛,各地的环境差异,如土壤成分、气候条件以及栽培方式,都会影响丹参的化学成分,从而导致不同产地丹参在质量和功效上的差异。因此,确保丹参的产地真实性成为推动其产业发展和保障消费者权益的关键环节。

为了应对这一挑战,研究人员开始探索更高效、非破坏性的检测方法,以实现对丹参产地的精准识别。传统的检测方法往往依赖于化学分析或光谱分析,这些方法虽然在一定程度上有效,但存在操作复杂、成本高以及需要破坏性样本处理等问题。随着科技的发展,高光谱成像(Hyperspectral Imaging, HSI)作为一种融合光谱信息和图像数据的非破坏性检测技术,逐渐成为研究热点。HSI技术能够同时获取样本的光谱数据和视觉特征,为分析丹参的化学成分和外观特征提供了丰富的信息来源。

在本研究中,科研人员采用了高光谱成像技术,结合三种不同的数据融合策略,以提升丹参产地分类的准确率。具体来说,他们收集了来自中国29个不同地区的丹参根部样本,构建了一个涵盖可见光至近红外(VNIR)和短波红外(SWIR)范围的高光谱数据库。通过对这些数据的分析,研究人员提取了三种类型的特征数据:VNIR光谱数据(Dataset A)、图像颜色信息(Dataset B)以及SWIR光谱数据(Dataset C)。随后,他们分别利用卷积神经网络(CNN)、Transformer模型和CNN-Transformer混合模型,对这些数据进行了建模和分类。

研究发现,单一数据源的分类模型虽然在一定程度上能够实现对丹参产地的识别,但其准确率有限。例如,基于SWIR光谱数据的Transformer模型在单个数据集上达到了93.68%的分类准确率,而基于颜色信息的模型则表现出较低的分类能力。为了进一步提升准确率,研究者引入了三种数据融合策略:数据级融合、特征级融合和决策级融合。其中,决策级融合策略表现最佳,通过将SWIR光谱数据与图像颜色信息进行整合,最终实现了高达98.72%的分类准确率。这一结果表明,通过融合多种数据源,可以更全面地捕捉丹参的化学特征和外观特征,从而提高其产地识别的准确性。

在具体的操作过程中,研究团队采用了先进的数据处理技术,包括基于阈值的自动分割算法、主成分分析(PCA)以及软投票(Soft Voting)方法。这些技术不仅能够有效去除背景噪声,还能提升模型的泛化能力和鲁棒性。此外,为了应对数据集中的类别不平衡问题,研究者还采用了合成少数类过采样技术(SMOTE)对数据进行增强,以确保每个类别都有足够的样本量进行训练和测试。最终,他们构建了一个包含26,100个样本的均衡数据集,并按照8:2的比例将其划分为训练集和测试集,确保模型在实际应用中的可靠性。

通过对比不同数据融合策略的分类效果,研究发现,决策级融合策略能够有效整合不同模型的预测结果,从而提高整体分类性能。与数据级融合相比,特征级融合虽然能够更快地收敛到最优模型,但其准确率略低。而决策级融合通过软投票方法,综合了多个模型的预测概率,提高了分类的稳定性和准确性。这一方法在实际应用中具有重要的价值,特别是在需要快速、非破坏性地对丹参进行产地鉴定的场景下。

此外,研究还指出,HSI技术具有非侵入性、非接触性和非破坏性的特点,能够为中药材的品质评估提供更加全面的信息。这不仅有助于提升丹参产地分类的准确性,还为其他中药材的产地溯源提供了新的思路和技术支持。例如,丹参的红色根部与丹参酮的含量密切相关,因此颜色信息可以作为评估其质量的一个直观指标。通过将颜色特征与光谱数据相结合,研究人员能够更全面地了解丹参的化学组成和外观特征,从而为药材质量控制和产地溯源提供可靠的技术手段。

在实际应用中,研究者还考虑了不同数据采集方式的成本效益。例如,仅使用VNIR高光谱成像系统进行数据采集,虽然准确率略低于结合SWIR数据的方式,但其成本更低,且设备技术更为成熟,适合大规模推广和应用。这一发现为未来丹参产地分类技术的商业化提供了重要的参考。同时,研究者也指出,由于气候变化等因素,不同年份采集的样本可能在化学组成和光谱特征上有所差异,因此需要定期更新数据集以确保模型的适应性和准确性。

综上所述,本研究通过高光谱成像技术和多级数据融合策略,成功构建了一个能够准确识别丹参产地的分类模型。这一成果不仅为丹参的产地溯源提供了新的方法,也为其他中药材的品质评估和产地认证提供了借鉴。未来,随着相关技术的不断进步和应用的逐步扩大,丹参及其他中药材的产地识别将变得更加高效和精准,从而推动中医药产业的可持续发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号