
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于卷积神经网络和梯度加权类激活映射的拉曼光谱多标签识别技术在苹果混合农药检测中的应用
【字体: 大 中 小 】 时间:2025年06月06日 来源:Food Control 5.6
编辑推荐:
为解决苹果农药残留检测中传统方法耗时长、无法实时分析混合农药的难题,研究人员采用拉曼光谱结合机器学习(1-D CNN/SVM/PLS)开发多标签分类模型,成功实现9种农药活性成分的同步检测(如Captan F1>99%),并通过Grad-CAM解析关键光谱区域。该研究为食品安全监管提供了快速、精准的技术支持。
农药残留是威胁食品安全的核心问题之一。欧盟2021年报告显示,约2.3%的农产品样本存在农药超标现象。传统检测方法如液相色谱(LC-MS)虽灵敏度高,但存在耗时长(单样本需数小时)、成本高、依赖专业人员等缺陷。尤其当多种农药混合使用时,其复杂的非线性相互作用使得检测难度倍增。拉曼光谱技术因其"分子指纹"特性及秒级检测速度,成为解决这一难题的突破口。
西班牙农业食品技术研究所(IVIA)等机构的研究团队在《Food Control》发表论文,创新性地将1维卷积神经网络(1-D CNN)与梯度加权类激活映射(Grad-CAM)结合,实现了苹果表面9种常用混合农药的同步检测。研究首先建立了吡唑醚菌酯等纯化合物的特征光谱库,通过t-SNE和主成分分析(PCA)可视化验证了混合样本的可分性。随后对比了偏最小二乘(PLS)、支持向量机(SVM)和1-D CNN三种算法的性能,其中1-D CNN以最低汉明损失(0.02)和最高F1值(Captan达99%)胜出。Grad-CAM热力图进一步揭示了模型决策依赖的特定拉曼位移区间,如1680 cm-1
处的酰胺键振动峰对识别Captan起关键作用。
关键技术方法
研究采用便携式拉曼光谱仪(785 nm激光)采集纯化合物及混合样本光谱,通过标准正态变换(SNV)预处理消除基线漂移。建立包含比利时农场推荐浓度的9类农药数据集,采用t-SNE(困惑度=30)和PCA进行降维可视化。1-D CNN架构含3个卷积层(核大小=5)和全局平均池化层,以二元交叉熵为损失函数。Grad-CAM通过计算最终卷积层梯度生成类激活热力图。
农药光谱表征
纯化合物光谱显示,1680 cm-1
(Captan的C=O伸缩振动)和1150 cm-1
(Mancozeb的C-S键)等特征峰在混合体系中强度衰减50%,但经SNV预处理后仍保持可识别性。t-SNE二维投影显示纯化合物样本呈明显簇状分布,而混合样本位于各纯物质簇的过渡区域。
机器学习模型比较
1-D CNN在测试集表现最优,汉明损失比SVM降低42%,对Folpet的召回率提升至87%。模型对独立测试集(含未训练比例组合)仍保持85%平均准确率,证实其泛化能力。Grad-CAM分析显示,模型对硫代氨基甲酸酯类农药(如Mancozeb)主要关注650-750 cm-1
的S-S伸缩振动区。
结论与意义
该研究首次实现拉曼光谱对复杂农药混合体系的多标签识别,1-D CNN模型突破传统ML对非线性关系的建模局限。Grad-CAM的可解释性分析证实模型并非简单记忆光谱特征,而是学习到与分子结构相关的物理化学规律。技术推广后,可帮助超市等供应链环节实现农药残留的现场筛查,将单样本检测成本从色谱法的50欧元降至0.5欧元。未来研究需扩大农药种类库并开发抗荧光干扰算法,以应对实际场景中更复杂的基质效应。
生物通微信公众号
知名企业招聘