
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多核注意力机制CNN的柑橘植物病害分类模型研究
【字体: 大 中 小 】 时间:2025年07月06日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对柑橘植物病害早期识别难题,提出融合多核卷积神经网络(MKCNN)与通道-空间双注意力机制的创新模型。通过整合VGG16、ResNet50等预训练网络特征,采用1D/2D多尺度卷积核提取跨通道与空间关联特征,在自建、柠檬和柑橘三个数据集上实现99.3%的分类准确率,较传统模型提升6.66%。该成果为农业智能化病害监测提供高效解决方案,发表于《Scientific Reports》。
柑橘作为全球重要的经济作物,其产量直接关系到数十亿美元规模的农业经济。然而,黑斑病、疮痂病等病害每年造成高达30%的产量损失,传统人工检测方法效率低下且依赖专家经验。尽管已有研究尝试应用机器学习,但面临特征提取依赖人工、模型泛化能力差等瓶颈。如何实现高精度、自动化的早期病害识别,成为智慧农业领域亟待突破的关键问题。
来自圣约瑟夫工程学院和安娜大学的研究团队在《Scientific Reports》发表创新成果,提出多核卷积神经网络(MKCNN)与注意力机制融合的解决方案。该研究通过整合三种不同来源的12,769张柑橘叶片图像,构建了包含健康与病变样本的双分类体系。实验表明,模型在自建数据集上达到99.5%的准确率,较传统VGG16提升4.24%,为田间实时病害监测提供了可靠的技术支持。
研究采用三大关键技术:首先通过高斯滤波和CLAHE(对比度受限自适应直方图均衡化)进行图像预处理;其次利用VGG16、ResNet50等四种预训练网络进行迁移学习特征提取;最后创新性地设计多核注意力模块,采用1D卷积核(1,3,5)和2D卷积核(1×1,3×3,5×5)分别捕获通道与空间特征,通过特征图逐元素相乘实现信息融合。
模型架构设计
研究团队构建的三阶段框架包含预处理、特征提取和注意力分类模块。如图1所示,输入图像经尺寸标准化至224×224像素后,通过不同尺度的卷积核并行提取特征。特别值得注意的是通道注意力模型(CAM)采用全局平均池化(GAP)压缩特征,其权重计算如公式(5)所示,通过1D卷积核实现多尺度特征交互。
性能验证
在柠檬数据集测试中,模型表现出99.4%的准确率和99.8%的特异性(表3)。图8的混淆矩阵显示,2000张测试图像中仅20例误判。对比实验表明,该模型较MobileNetV2提升24.67%准确率,验证了多核结构的优越性。
技术优势分析
研究揭示了传统方法的三大局限:VGG16的梯度消失问题、ResNet50的计算冗余以及InceptionV3的数据量需求。而本研究的创新点在于:1)通过公式(1)-(3)实现通道与空间注意力特征图的串联融合;2)采用公式(7)-(8)的逐元素乘法保留关键病理特征;3)使用Dropout正则化解决小样本过拟合问题。
讨论部分指出,虽然模型在准确率方面表现突出,但仍存在两方面的应用限制:一是当前仅支持二分类,无法区分具体病害类型;二是计算复杂度较高,在边缘设备部署时需进行模型压缩。作者建议未来研究可结合生成对抗网络(GAN)扩充样本多样性,并探索知识蒸馏等模型轻量化技术。
这项研究的重要意义在于:首次将多核卷积与双注意力机制协同应用于农业病害识别,为作物保护提供了可解释性强的深度学习框架。如图4所示的ROC曲线证实,模型在保持99%敏感度的同时实现99.29%特异性,这种平衡性使其特别适合田间复杂环境下的实时监测需求。该成果不仅推动了计算机视觉在精准农业中的应用,也为其他作物病害识别提供了可迁移的技术范式。
生物通微信公众号
知名企业招聘