基于双注意力CNN-LSTM的高光谱成像技术实现烟叶尼古丁含量精准预测

《Industrial Crops and Products》:Fusing band and feature attention in CNN-LSTM: A dual-attention framework for Hyperspectral-based precise prediction of nicotine levels in cured tobacco leaves

【字体: 时间:2025年10月18日 来源:Industrial Crops and Products 6.2

编辑推荐:

  本研究针对烤烟叶片关键化学成分快速无损检测的工业难题,提出了一种结合高光谱成像(HSI)与双注意力增强深度神经网络的新型智能预测框架。研究人员通过多区域光谱采集策略获取代表性反射数据,开发了融合波段注意力(BA)与自注意力(SA)机制的DACL模型,实现了对尼古丁含量的精确预测(R2=0.857,RMSE=0.443,RPD=2.642)。该研究为烟草加工质量控制提供了可靠的技术支持,展现了人工智能驱动的高光谱分析在农产品评估中的广阔应用前景。

  
在烟草工业中,快速准确地测定烤烟叶片中的关键化学成分一直是制约产品质量控制的重要瓶颈。传统方法如高效液相色谱法等虽然准确度高,但需要破坏样品、耗时耗力,无法满足现代工业生产对实时检测的需求。近红外光谱技术虽有所改进,仍存在样本前处理复杂、预测精度有限等问题。随着高光谱成像(HSI)技术的兴起,这一能够同时获取空间和光谱信息的新方法为农产品无损检测带来了希望,然而如何从海量光谱数据中提取有效特征并建立精准预测模型仍是当前研究的挑战。
针对这一技术难题,中国农业科学院烟草研究所的研究团队在《Industrial Crops and Products》上发表了创新性研究成果。他们开发了一种名为DACL的双注意力增强型CNN-LSTM框架,成功实现了烤烟叶片尼古丁含量的高精度无损检测。该研究通过多区域光谱采集策略,从烟叶的叶尖、中部和基部系统采集反射光谱数据,有效克服了烟叶化学成分空间分布不均对检测结果的影响。
研究团队采用的关键技术方法包括:首先建立了标准化的高光谱图像采集流程,使用线扫描CCD相机和成像光谱仪获取1000-2500nm范围内的245个波段的光谱数据;其次开发了多区域感兴趣区域(ROI)选择算法,从每个烟叶样本中提取4000个有效像素点的平均光谱;然后系统比较了SG平滑、一阶导数(1D)、多元散射校正(MSC)和均值中心化(MC)等光谱预处理方法的效果;最后构建了融合波段注意力(BA)和自注意力(SA)机制的双注意力CNN-LSTM模型,实现了从光谱输入到深层特征的全方位优化。
3.1. 烟叶样品尼古丁含量分析
通过对红花大金元、K326和云烟105三种烟草品种的尼古丁含量统计分析发现,不同品种间存在显著差异。红花大金元的尼古丁含量分布最广(1.3%-6.95%),K326相对集中(2.09%-5.39%),云烟105分布范围居中(1.21%-5.13%)。这种多样性为建立稳健的预测模型提供了良好的数据基础。
3.2. 烟叶光谱响应分析
比较烟叶不同部位的光谱特征发现,中部区域反射率最高,且整体平均光谱曲线最能代表整片烟叶的光学特性。在1000-2500nm范围内观察到多个吸收峰,分别位于1430、1620、1730、1910、2060和2210nm附近,这些特征峰与尼古丁分子中C-H、N-H和C-N键的振动吸收密切相关。
3.3. 不同ROI对模型的影响
研究表明,基于多区域平均光谱建立的模型显著优于仅使用中心区域光谱的模型。在相同预处理条件下,SVR模型的表现优于PLSR,证实了非线性建模方法在处理复杂光谱-成分关系方面的优势。统计检验结果进一步验证了多区域光谱策略的优越性。
3.4. 基于深度学习的尼古丁预测模型建立
在深度学习模型比较中,CNN-LSTM混合模型表现出最佳性能,测试集R2达到0.768,RPD为2.074。一阶导数预处理能有效增强细微光谱特征,提高模型预测精度。训练过程显示CNN-LSTM具有更快的收敛速度和更好的稳定性。
3.5. 基于波段注意力模块的改进
引入波段注意力机制后,模型能够自动识别并强化与尼古丁相关的特征波长(如1200、1430、1620、1730、1910、2060和2210nm附近)。BA-CNN-LSTM模型在测试集上的R2提高至0.83,RPD达到2.427,证明了注意力机制在特征选择中的有效性。
3.6. 基于深层特征自注意力模块的改进
在波段注意力基础上加入深层特征自注意力模块,形成了完整的DACL架构。该模块能对卷积层提取的特征进行动态权重分配,进一步优化特征表示。最终DACL模型在测试集上取得了R2=0.857、RMSE=0.443、RPD=2.642的优异性能。
3.7. 尼古丁含量预测模型比较
通过对比不同模型的预测残差分布发现,DACL模型在所有浓度范围内都表现出最小的预测偏差和最优的稳定性,特别是在高尼古丁含量样本(>4%)中仍保持较高精度,展现了双注意力机制在复杂样本处理中的优势。
研究结论表明,融合多区域光谱采集和双注意力机制的DACL框架为烤烟尼古丁含量的无损检测提供了创新解决方案。该方法不仅实现了高精度预测,还通过注意力权重的可视化提供了模型决策的物理解释,与尼古丁的已知特征吸收波段高度吻合。这种将深度学习与高光谱技术相结合的策略,不仅适用于烟草质量检测,还可推广到其他农产品的化学成分快速评估领域,为智慧农业和精准农业的发展提供了重要的技术支撑。
研究的局限性在于目前仅验证了三个烟草品种,未来需要扩展更多品种和生长条件以增强模型的普适性。同时,模型压缩和边缘计算部署将是下一步研究的重点方向,以期实现该技术在工业生产现场的实时应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号