红外光谱结合化学计量学实现天麻地理起源的快速无损鉴别

《Lung Cancer》:Rapid and non-destructive identification of Gastrodia elata Blume geographical origin by infrared spectroscopy combined with chemometrics

【字体: 时间:2025年12月28日 来源:Lung Cancer 4.4

编辑推荐:

  本研究针对天麻地理起源鉴别难题,创新性地结合近红外光谱、衰减全反射-傅里叶变换红外光谱和二维相关光谱技术,应用偏最小二乘判别分析、支持向量机和残差卷积神经网络模型,实现了七个产地天麻样本的精准鉴别。其中基于NIR和NIR+ATR-FTIR数据建立的ResNet模型准确率达100%,为中药材产地溯源提供了快速、无损、可靠的新方法。

  
天麻作为一种珍贵的中药材和药食同源植物,其品质与地理起源密切相关。不同产地的天麻因生长环境差异导致化学成分存在显著区别,直接影响其药用价值。然而在市场上,不法商贩常将不同产地的天麻混充销售以牟取暴利,传统的外观鉴别方法难以准确区分,而高效液相色谱、气相色谱-质谱联用等分析技术虽然准确度高,但存在样品破坏性大、耗时长、操作复杂等局限性。因此,开发快速、无损、准确的天麻地理起源鉴别方法具有重要的现实意义。
本研究采用近红外光谱和衰减全反射-傅里叶变换红外光谱技术,结合化学计量学方法,对来自贵州毕节、四川乐山、湖北恩施、湖北宜昌、云南楚雄、云南迪庆和云南昭通七个产区的210个天麻样本进行地理起源鉴别分析。研究人员首先通过主成分分析和t-分布随机邻域嵌入两种无监督学习方法进行数据可视化分析,发现单一光谱数据难以有效区分不同产地的样本。随后比较了多种光谱预处理方法,建立了偏最小二乘判别分析和支持向量机模型,并创新性地将二维相关光谱图像与残差卷积神经网络相结合,构建了更为高效的鉴别模型。
关键技术方法包括:使用NIR和ATR-FTIR光谱仪采集光谱数据;采用Kennard-Stone算法按7:3比例划分训练集和测试集;应用Savitzky-Golay平滑、标准正态变换、多元散射校正、一阶导数和二阶导数等预处理方法;基于低水平数据融合策略整合多源光谱数据;生成同步、异步和集成二维相关光谱图像;建立偏最小二乘判别分析、支持向量机和残差卷积神经网络分类模型。
3.1 天麻光谱数据分析
通过NIR和ATR-FTIR光谱分析发现,不同产地天麻样本在吸收峰位置相似但吸光度存在差异。NIR光谱在8303 cm-1(C-H伸缩振动二级倍频)、6822 cm-1(O-H伸缩振动一级倍频)等处显示特征吸收峰,而ATR-FTIR光谱在3285 cm-1(N-H伸缩振动)、1630 cm-1(C=O键)等位置呈现明显吸收。云南产区的样本吸光度普遍高于其他地区,表明红外光谱能有效捕捉天麻地理差异信息。
3.2 无监督模型
主成分分析和t-分布随机邻域嵌入分析结果显示,不同产地天麻样本在得分图上存在大量交叉重叠,无法实现有效区分。ATR-FTIR数据的分类效果略优于NIR和数据融合结果,可能与中红外光谱包含指纹区信息有关。
3.3 有监督模型
3.3.1 PLS-DA模型分析
经过多种预处理方法比较,基于NIR数据采用FD+SNV预处理建立的PLS-DA模型表现最佳,训练集和测试集准确率分别达到100%和98.41%。200次置换验证表明模型未出现过拟合。
3.3.2 SVM模型分析
基于NIR+ATR-FTIR数据采用SD预处理建立的SVM模型获得最优分类性能,训练集和测试集准确率均为100%和98.41%。网格搜索法确定最佳参数c=32,g=1.22×10-4
3.3.3 ResNet模型分析
基于同步二维相关光谱图像建立的ResNet模型表现最为优异,使用NIR和NIR+ATR-FTIR数据时,训练集、测试集和外部验证集准确率均达到100%。模型收敛速度快,在18个周期时准确率即达到1,损失函数值在49个周期时降至0.055左右。与PLS-DA和SVM模型相比,ResNet模型无需复杂预处理步骤即可获得优异分类效果。
针对实际应用中样本量不均匀的问题,研究人员将样本按省份重新划分为四个地理来源进行验证。结果显示,基于NIR和NIR+ATR-FTIR数据建立的ResNet模型仍能保持100%的准确率,表明该模型具有良好的鲁棒性和实际应用价值。
本研究系统比较了多种光谱分析技术和机器学习算法在天麻地理起源鉴别中的应用效果。传统机器学习方法如PLS-DA和SVM虽然能够实现较高分类准确率,但其性能严重依赖预处理方法的选择。而基于二维相关光谱图像的ResNet模型展现了明显优势,不仅准确率高,而且无需复杂预处理,大大简化了分析流程。特别是同步二维相关光谱图像能够增强光谱分辨率,识别重叠峰,为深度学习模型提供更丰富的特征信息。
研究结果表明,近红外光谱在捕获天麻地理起源差异信息方面优于衰减全反射-傅里叶变换红外光谱,这可能与近红外光谱区域包含更丰富的化学成分信息有关。数据融合策略虽然在一定程度上提高了模型性能,但也增加了计算复杂度,在实际应用中需要权衡时间成本与准确率要求。
该研究建立的ResNet模型为天麻地理起源鉴别提供了一种快速、无损、准确的新方法,对保障中药材质量安全、规范市场秩序具有重要意义。该方法可推广应用于其他药食同源植物的产地溯源研究,为中药材质量控制提供了新的技术支撑。未来通过扩大样本量和涵盖更多天麻品种,有望进一步验证和提升模型的泛化能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号