混合深度学习模型在枣椰树病害分类中的应用:HybridConv Mixer与视觉Transformer的融合

【字体: 时间:2025年10月23日 来源:Food Science & Nutrition 3.8

编辑推荐:

  本文提出了一种融合HybridConv Mixer与视觉Transformer(ViT)的混合深度学习模型,用于枣椰树叶片病害的自动化分类。该模型通过结合局部特征提取与全局上下文分析,在Brown Spots和White Scale等病害分类中实现了99.89%的准确率,显著优于传统CNN模型,为精准农业提供了高效可靠的病害识别技术。

  
枣椰树病害分类的混合深度学习模型研究
摘要
枣椰树(Phoenix dactylifera L.)是干旱地区重要的农业经济作物,但其常受到褐斑病(Brown Spots)和白蜡蚧病(White Scale)的威胁,导致产量下降和品质受损。传统人工检测方法效率低且易出错,亟需自动化病害识别系统。本研究提出一种结合HybridConv Mixer和视觉Transformer(ViT)的混合深度学习模型,通过融合局部特征与全局依赖关系,显著提升了病害分类的准确性和鲁棒性。实验结果表明,该模型在包含2631张图像的数据集上达到了99.89%的准确率,优于单一卷积神经网络(CNN)模型。
引言
枣椰树作为中东、北非和南亚地区的重要经济作物,其果实富含碳水化合物、维生素和矿物质,是数百万人的主食来源。然而,病害的蔓延严重影响了枣椰树的产量和品质。褐斑病由真菌Graphiola phoenicis引起,表现为叶片出现褐色至黑色圆形病斑,严重时导致叶片坏死;白蜡蚧病则由昆虫Parlatoria blanchardi引发,叶片表面形成白色蜡质沉积,阻碍光合作用。传统依赖人工视觉的检测方法主观性强、耗时长,且易误判。近年来,计算机视觉与深度学习技术的结合为植物病害诊断提供了新的解决方案。
相关研究
现有研究多基于卷积神经网络(CNN)进行病害分类,如ResNet、MobileNet和EfficientNet等模型在植物病害检测中取得了较高准确率。然而,传统CNN模型在处理复杂背景、光照变化和病害症状多样性时表现有限。视觉Transformer(ViT)通过自注意力机制捕捉图像全局信息,在图像分类任务中展现出优势。近期研究开始探索CNN与Transformer的混合架构,以兼顾局部特征和全局上下文信息。例如,Pacal等人将CNN与ViT结合用于玉米病害检测,证明了混合模型的有效性。
研究方法
数据集
本研究使用两个公开数据集:Kaggle的“Date Palm Data”(2631张图像,包含褐斑病、健康和白蜡蚧病三类)和“Infected Date Palm Leaves by Dubas Insects”(3000张无人机拍摄图像,包含健康、仅虫害、仅蜜露和混合感染四类)。图像统一调整为224×224像素,并按75%:25%的比例划分为训练集和验证集。
数据预处理
为增强模型泛化能力,对训练集进行了数据增强操作,包括随机旋转(±30°)、平移、剪切、缩放(0.8×–1.2×)和水平翻转。针对类别不平衡问题,对少数类样本进行了过采样,使训练集分布更均衡。
模型架构
提出的混合模型由HybridConv Mixer和ViT两部分组成:
  • HybridConv Mixer包含三个卷积层(滤波器数分别为32、64、128),每层后接批量归一化(Batch Normalization)和ReLU激活函数,最后通过全局平均池化(Global Average Pooling)提取128维局部特征。
  • ViT将图像分割为16×16的块(patches),通过线性投影和位置编码后输入Transformer编码器,捕捉图像全局依赖关系,输出1280维特征向量。
    两种特征向量拼接后(1408维)输入全连接层(256和128神经元)进行分类,最终通过Softmax层输出三类概率。
结果与讨论
模型在测试集上表现优异:
  • HybridConv Mixer单独准确率为94%,宏平均F1分数0.93;
  • ViT单独准确率为97%,宏平均F1分数0.97;
  • 混合模型准确率达99%,宏平均F1分数0.99,且在所有类别上均保持高精度(褐斑病精度1.00、召回率0.95;健康类精度0.98、召回率1.00;白蜡蚧病精度和召回率均为1.00)。
    混淆矩阵显示,混合模型仅误分1例褐斑病样本,其余全部正确。通过Grad-CAM可视化发现,模型注意力集中在病害区域(如褐斑病变部位、白蜡蚧沉积区),表明其决策依据具有可解释性。
与传统模型对比
与MobileNet(92%)、Xception(95%)、ResNet50(96%)和AlexNet(97.5%)相比,混合模型在准确率、精确度和召回率上均显著提升。消融实验进一步证实,HybridConv和ViT的互补性是其高性能的关键。
计算效率分析
混合模型参数量为42.1M,推理速度42ms/图像,在保证高精度的同时具备实际部署潜力。未来可通过剪枝、量化等优化技术进一步提升效率。
结论与展望
本研究提出的HybridConv Mixer与ViT混合模型在枣椰树病害分类中表现出色,兼顾了局部特征细节和全局上下文信息。未来工作将扩展至病害严重度评估、多模态数据融合(如高光谱图像)及轻量化部署,以推动精准农业的智能化发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号