基于深度学习(CNN+SVM)的苹果叶部病害移动端检测系统App2的开发与应用
《Frontiers in Artificial Intelligence》:App2: software solution for apple leaf disease detection based on deep learning (CNN+SVM)
【字体:
大
中
小
】
时间:2025年10月15日
来源:Frontiers in Artificial Intelligence 4.7
编辑推荐:
本文推荐了一款基于深度学习(CNN+SVM)混合模型的苹果叶部病害移动检测应用App2。该系统通过卷积神经网络(CNN)进行特征提取,并利用支持向量机(SVM)实现高效分类,在测试中达到95%的准确率。应用集成了React Native前端、FastAPI后端及OpenAI API图像预筛选功能,有效提升了在真实田间环境下的诊断可靠性(80%)。用户评估显示其具有高可用性,为农业生产提供了便捷、可靠的病害监测工具。
苹果生产在秘鲁农业经济中扮演着重要角色,全国种植面积超过11,000公顷,其中利马地区集中了约80%的全国产量。然而,其生产力持续受到由真菌和细菌引起的叶部疾病的威胁,这些疾病的发病率因不良农业实践和不可预测的气候现象(如厄尔尼诺)而加剧。在利马东南部地区,由于缺乏植物检疫知识和适当的治疗方法,这些疾病已导致产量减少高达20%。这种情况使得早期和准确的诊断变得不可或缺。但传统的病害识别由于不同病原体症状的视觉相似性以及湿度、光照和温度等环境变量的影响而变得复杂。此外,还依赖于人工判断以及对偏远农业地区的有限可及性,这阻碍了及时的干预。尽管全球存在基于深度学习的解决方案,但许多当前模型过于复杂或要求过高,无法在移动设备上有效实施。
在此背景下,提出了App2,这是一种基于深度学习的混合模型,结合了用于特征提取的卷积神经网络(CNN)和用于分类的支持向量机(VM)。最终,该模型在检测苹果树叶的六种主要状况(黑腐病、锈病、黑星病、健康、白粉病和红蜘蛛)方面达到了95%的准确率。其轻量级架构,仅98.4 K参数,使其非常适合集成到移动应用程序中,实现云端的实时检测。该解决方案属于计算机视觉领域,应用先进的图像分析技术来识别疾病和害虫的特征性视觉模式。该工具旨在为农民提供一种易于使用、可靠且快速的解决方案,使其能够在田间及时做出决策。通过提供精确的检测,而无需昂贵的设备或先进的技术专业知识。
近年来,已经提出了几种基于机器学习和计算机视觉的方法来检测作物病害,利用图像分析技术自动、准确地检测视觉症状。Bi等人(2020)开发了一个使用MobileNet架构的苹果叶部病害识别系统,MobileNet是一种轻量级卷积神经网络模型,设计用于在移动设备上高效运行。为了实现良好的性能,该模型在由中国陕西农业专家收集的数据集上进行了训练,包括受Alternaria叶斑病和锈病影响的叶片图像。应用了数据增强技术,如旋转、裁剪和灰度缩放,提高了模型对图像变化的鲁棒性。实验结果表明,MobileNet达到了73.50%的准确率,每张图像的平均处理时间为0.22秒,这比InceptionV3(0.45秒内75.59%)和ResNet152(0.79秒内77.65%)等模型快得多。尽管ResNet152的准确率略高,但其效率要低得多,使其在移动应用中的可行性较低。最后,使用的有限数据集(2,004张图像)影响了系统的准确性和泛化能力。
Sanida等人(2022)提出了一种基于卷积神经网络(CNN)的混合模型,用于使用PlantVillage数据集中的图像进行精确的番茄叶部病害检测。该架构结合了VGG16模型的块和一个Inception模块,从而利用了两者在多个尺度和深度上提取特征的能力。该模型使用通过数据增强技术(如旋转、平移、缩放和镜像)生成的超过76,000张图像进行训练。这种混合结构包括13个卷积层、5个最大池化层、一个Inception模块、一个全局平均池化层和一个softmax分类层,所有层均使用Adam算法和0.0001的学习率进行优化。该混合模型的结果优于ResNet152和InceptionResNet等先进模型,达到了99.17%的准确率、99.23%的召回率、99.17%的F1分数和99.56%的AUC。这种混合方法被证明对农业应用非常有效。然而,一个潜在的局限性是所使用的数据集由在受控条件下拍摄的图像组成,具有中性背景和居中的叶片,这可能会限制模型在光照和背景可变性显著的真实田间场景中的泛化能力。
Ksibi等人(2022)提出了MobiRes-Net,一种集成ResNet50和MobileNet架构的混合深度学习模型,旨在检测和分类橄榄叶病害。在沙特阿拉伯Al Jouf地区使用无人机共收集了5,400张叶片图像,并分为四类:健康叶片、Aculus olearius、橄榄疮痂病和孔雀斑病。图像经过预处理(调整大小为224×224像素、归一化和对比度增强)并采用数据增强技术以提高模型鲁棒性并避免过拟合。MobiRes-Net使用预训练权重进行训练,替换了每个网络的原始分类层,并连接它们的全连接层,形成一个在输出端带有Softmax的联合分类器。该模型使用TensorFlow和Keras实现,分类准确率达到97.08%,显著优于ResNet50(94.86%)和MobileNet(95.63%)。此外,它还获得了96.86%的F1分数和97.11%的召回率,在所有类别中显示出一致的结果。然而,尽管准确率高,但混合模型的复杂结构导致训练和推理时间比单个架构更长,并且需要高性能硬件。
Nag等人(2023)提出了一款使用卷积神经网络(CNN)和迁移学习技术的番茄叶部病害识别移动应用。对五个在ImageNet上预训练的模型(AlexNet、ResNet-50、SqueezeNet-1.1、VGG19和DenseNet-121)进行了微调,以分类十个番茄病害类别,包括健康图像。数据集包括超过19,000张图像,来源于PlantVillage存储库和在田间捕获的专有数据库。应用了数据增强变换(旋转、缩放、翻转)以改进泛化能力。DenseNet-121模型表现最佳,达到99.85%的准确率,优于VGG19(99.74%)和ResNet-50(99.79%)。训练进行了40个周期,使用Adam优化器并对最后几层进行微调以适应10个类别。最终,开发了一款跨平台移动应用,使用Flutter和Django后端构建,允许用户拍摄或上传番茄叶照片,将其发送到网络服务器进行处理,并在几秒钟内接收预测结果。该应用提供英语、印地语和阿萨姆语版本,旨在促进英语水平有限的印度农民的可及性。虽然该系统展示了高准确性和可用性,但其性能仍然高度依赖于输入图像的质量。低分辨率、光照条件差或智能手机摄像头捕获的模糊图像可能会引入噪声或偏差,可能导致在实际使用中出现错误分类。
Chen等人(2024)提出了一种使用改进版YOLOv8(称为YOLOv8-ACCW)检测葡萄叶部病害的轻量级方法,旨在提高检测精度并便于在移动设备上部署。该模型针对三种常见的葡萄病害——黑根病、黑麻疹病和枯萎病,并集成了几个模块以克服先前算法的局限性。这些包括AKConv模块,它取代了传统卷积以实现任意采样并减少参数;坐标注意力(CA)机制,增强了特征提取同时抑制不相关信息;以及CARAFE模块,改善了特征重组能力。此外,传统的损失函数被Wise-IoU取代,以优化边界框回归,特别是在小病害区域。该模型实现了92.4%的F1分数、92.8%的mAP50和73.8%的mAP50-95,在准确性和计算效率方面均优于原始算法。尽管有这些进展,该研究强调需要扩展数据集以包括更广泛的葡萄病害,并改进算法在具有挑战性的真实世界条件(如强反射或极低光照环境)下的鲁棒性。
Pineda Medina等人(2024)介绍了一款用于马铃薯作物病害检测的轻量级离线移动应用的开发。使用来自PlantVillage数据集的图像,作者评估了五种CNN架构(MobileNetv2、VGG16、VGG19、InceptionV3和Xception),其中MobileNetv2因其在准确性(98.7%)和计算效率之间的平衡而脱颖而出。该应用兼容Android 4.1及以上版本,且不需要互联网连接,旨在通过实时捕获或从相册中选择的叶片图像来检测常见的马铃薯病害,如早疫病和晚疫病。MobileNetv2模型分三个阶段进行训练,逐步增加层数和周期数,在不发生过拟合的情况下实现了高准确率。与更复杂的架构相比,由于其小尺寸(3.89 MB)和可训练参数数量少,它被证明是最适合直接集成到移动设备中的模型。此外,该应用还包括一个关于马铃薯病害的信息部分。作为局限性,作者强调需要扩展系统以分类其他相关病理,如丝核菌病和细菌病,这些在马铃薯种植中也很重要。
对于所提出模型的训练,使用了一个根据存在的病害分类的苹果叶片图像数据集。所有图像被调整大小为统一的256×256像素,并通过将像素值除以255进行归一化。数据集的构建遵循了平衡策略:包括了PlantVillage数据集中的所有可用图像(占总数的22.6%),并用来自Plant Pathology 2021的额外图像进行补充,直到每个病害类别(黑星病、黑腐病、锈病)达到2,000张图像,健康类别达到4,000张图像。这确保了既代表了受控实验室条件,又包含了来自田间环境的视觉变异性(例如,异质光照、自然背景、重叠叶片),这约占最终数据集的65.6%。
还加入了两个对秘鲁农业高度相关的额外类别:红蜘蛛和白粉病。红蜘蛛的图像来自Mendeley Data中可用的ARoja 2022数据集,而白粉病图像来自Kaggle上的Apple Leaf Disease Powdery Mildew数据集。这两个来源都包含田间收集的、标记的图像,适用于模型训练。
为了增加类内变异性并实现数据集平衡,应用了数据增强,使用Keras的ImageDataGenerator,参数如下:随机旋转高达40°,水平和垂直平移高达图像大小的20%,水平和垂直翻转(概率=0.5),缩放范围高达20%,以及用于缺失像素的最近邻填充。这些变换生成了大约1,653张额外的合成图像(占数据集的11.8%),产生了一个最终包含14,000张图像的数据集,分布在六个平衡的类别中。
这种策略允许构建一个平衡且视觉多样化的数据集,反映了实验室和真实世界场景。包含具有不同条件的田间图像增强了模型在移动设备上用于实际应用时的泛化能力。
近年来,卷积神经网络(CNN)与基于支持向量机(SVM)的分类器的组合在计算机视觉和图像分类相关的各种研究中越来越受欢迎,特别是在生物医学和农业应用中。
如图所示,这种混合架构基于CNN自动、分层地从复杂视觉数据中提取判别性特征的能力,以及SVM作为强大分类器在高维空间中寻找最优边界的能力。大量研究表明,在最后阶段用SVM分类器替换传统的密集层可以提高模型泛化能力,减少过拟合,并在有限或不平衡数据集上获得更高的准确率。
所提出模型的过程从获取苹果叶片图像开始,这些图像被调整大小为统一的256×256像素分辨率以确保处理的一致性。如图所示,这些图像被输入到一个由多个块组成的卷积神经网络(CNN)中,这些块结构包括卷积层、ReLU激活、批量归一化和最大池化。通过这种架构,网络能够提取重要的视觉特征,如边缘、纹理、斑点图案和颜色变化,这些是黑星病、黑腐病、锈病、白粉病和红蜘蛛等疾病的指示特征。随着数据在网络中深入,过滤器数量增加(32、64、128和256),允许模型捕获低层和高层信息。还集成了丢弃率为0.3的Dropout层以减轻过拟合并增强模型的泛化能力。
在通过CNN处理之后,应用一个全局平均池化2D层,将每个激活图转换为一个平均值,并生成一个紧凑且具有判别性的特征向量。该向量用作支持向量机(SVM)分类器的输入,该分类器将数据投影到高维空间,以找到一个最优分离类别(黑腐病、健康、白粉病、锈病、黑星病和红蜘蛛)的超平面。在训练阶段,CNN学习识别视觉模式,而SVM调整定义类别间边界的参数。
在推理阶段,新图像由CNN处理以提取其特征,然后由SVM进行分类,准确确定疾病的存在或确认叶片的健康。
卷积神经网络(CNN)使用Adam优化器进行训练,恒定学习率为0.001。模型训练了20个周期,批次大小为32。准确率和损失的训练和验证曲线如图所示。训练准确率在20个周期内显示出持续上升的趋势,而验证准确率有所波动,在后期周期稳定在85%以上。这种行为表明模型正在有效学习,尽管验证结果的一些方差可能表明对特定样本的敏感性。训练和验证损失曲线进一步支持了这一结论:训练损失稳步下降,尽管验证损失表现出一些振荡,但通常保持较低,表明具有良好的泛化能力且没有显著的过拟合。
训练后,从CNN的全局平均池化层提取的特征向量被用作支持向量机(SVM)分类器的输入。采用网格搜索策略来优化SVM超参数。正则化参数C用值[0.1, 1, 10]进行测试,并评估了两种核类型:线性和径向基函数(rbf)。使用C=10和RBF核获得了最佳结果,平均测试得分为95.67%。
该移动应用使用React Native开发,这是一个跨平台开发框架,允许从TypeScript的单一代码库创建原生Android移动应用。该技术促进了敏捷且适应不同设备的实现。用户界面设计直观且易于访问,允许用户执行以下主要操作:
? 直接从设备摄像头拍照。(最低版本Android 6.0)
? 显示模型的检测结果,以及检测到的疾病的简要描述和基本建议。
检测模型和移动应用以有组织的方式连接,每个部分在解决方案架构中履行明确的功能。首先,用户通过具有互联网连接的Android移动设备访问该应用。通过此应用,用户可以拍摄照片或上传现有的苹果树叶图像,以实现即时检测。
移动界面使用React Native开发,实现了无缝的用户体验。一旦用户选择或捕获图像,它通过使用FastAPI和Python开发的API发送到服务器。该API托管在Azure云平台上,确保了服务的可扩展性和可用性。为了存储与诊断、用户日志和其他交互相关的信息,使用了SQLite数据库,该数据库因其轻量级特性以及与基于FastAPI的服务易于集成而被选中。
在图像由检测模型分析之前,使用OpenAI API执行中间验证步骤。该过滤器负责确认用户提交的图像是否确实包含作物叶片。如果图像不符合此标准,系统会通知用户并提示其上载或拍摄不同的照片。此步骤对于防止错误检测和保持系统质量至关重要,因为它确保只处理有效图像。
如果图像通过验证过滤器,则将其发送到检测模型,该模型由混合CNN+SVM架构组成。卷积神经网络(CNN)使用TensorFlow开发,而支持向量机(SVM)组件使用scikit-learn库实现。一旦疾病检测过程完成,结果通过移动应用返回给用户。这种端到端的流程通过将人工智能技术与移动开发连贯且高效地集成,提供了强大可靠的用户体验。
使用三种广泛采用的轻量级CNN架构进行了比较评估:MobileNetV2、EfficientNetB0和ResNet50。评估采用了一致的指标,包括准确率、精确率、召回率和F1分数,以客观比较每个模型的分类性能。此外,还进行了消融研究,以检查基于OpenAI的图像验证过滤器对整体系统性能的影响。为此,使用相同的数据集评估了诊断系统的两种配置:一种包含验证过滤器以确保上传的图像包含叶片,另一种不包含。此比较旨在确定过滤器在减少错误分类和提高诊断输出可靠性方面的贡献。
App2移动应用的实验评估遵循严格且系统的方法,旨在验证分类模型的技术性能和用户体验。本次评估的主要目的是确保该工具在真实农业场景中准确、功能齐全且实用。
? 技术性能测试:将应用一组测试用例来评估应用的关键功能,例如图像上传和捕获、数据传输到服务器、接收检测结果以及在界面中正确显示结果。
? 用户体验问卷:农业部门的用户将参与现场测试,之后他们将完成一份旨在评估导航易用性、结果清晰度和整体满意度等方面的问卷。
这种双重方法提供了对应用技术性能及其被用户感知的接受度和实用性的全面视图。
为了对标所提出的混合模型的性能,使用众所周知的卷积神经网络(CNN)架构进行了比较分析。这些模型因其在图像分类任务中的效率和准确性而广受认可。所有模型都在相同的数据集上进行了训练和评估,并使用四个关键指标(准确率、精确率、召回率和F1分数)评估性能,确保所有方法之间的一致和客观比较。所有CNN架构均使用Adam优化器进行训练,恒定学习率为0.001。每个模型训练20个周期,批次大小为32,确保稳定收敛同时保持计算效率。
选择混合CNN+SVM架构而非独立的CNN模型是基于第3.2节中提供的理由并由我们的实验结果所强化。在比较测试中,当在相同数据集上评估时,CNN+SVM consistently achieved higher accuracy and more stable results than CNNs trained with a softmax classifier, such as MobileNetV2, EfficientNetB0, and ResNet50。这种改进突显了SVM在减少过拟合并增强泛化能力方面的能力,特别是在具有不同图像条件的异质数据集中。此外,轻量级CNN骨干仅98.4 K参数确保了在移动设备中的高效集成,而SVM层在不显著增加计算成本的情况下增强了鲁棒性。这使得混合方法比单独的CNN架构更适合农业中的实际移动应用。总结的结果证明了所提出的混合模型相对于其他轻量级CNN基线的有效性。
为了评估基于OpenAI API的过滤器的有效性,我们在500张手动标记的苹果叶片图像集上测试了其性能。该过滤器旨在在图像发送到诊断模型之前拒绝不包含叶片的图像。提示词引导模型评估图像中叶片的可见性和清晰度。使用的确切提示词如下:
系统提示词:“您是一个专门检测苹果叶片的图像筛选系统。您的任务是确定图像是否包含清晰可见的苹果叶片。叶片必须对焦清晰、与背景可区分且光照良好。忽略模糊、太暗、被遮挡或无法清晰识别叶片的图像。只有当您确信健康或患病的叶片清晰可见时,才返回‘1’;否则,返回‘0’。”
该过滤器正确接受了96.4%的有效图像,展示了高准确性和最小化相关数据损失。它的加入有助于减少误报,提高诊断精度,并通过确保只有干净、相关的内容到达疾病分类模型来简化整体图像流程。
进行了涵盖各种情况的测试,以评估App2移动应用的性能。这些测试的成功率如表所示。
总体成功率为95%,反映了高水平的技术性能,其中一些案例显示出主要与图像捕获相关的改进领域。
在案例测试001中,要求用户进入“诊断”部分,通过设备摄像头捕获叶片图像,并确认图像进行处理。该测试获得了70%的成功率,虽然未达到完全有效,但表明系统能够正确处理大部分捕获的图像。然而,错误主要与外部因素相关,如可变光照(例如,阴影或强阳光)、设备摄像头分辨率的限制以及次优的捕获角度。为了解决这些问题,未来的工作应探索改进,例如在提交图像前指导用户进行标准化图像捕获角度和距离的建议。这些改进将增强系统在真实田间条件下的可靠性。
测试案例003中观察到的改进,从40%提高到80%,可以通过算法增强和操作优化的结合来解释。在算法方面,通过将数据集扩展到14,000张图像(其中65.6%对应于田间条件)来加强了混合CNN+SVM模型。这种扩展,加上加入两个具有高度局部相关性的额外类别(白粉病和红蜘蛛),使模型实现了94.91%的内在分类准确率,为可靠检测提供了必要的基础。
从操作角度来看,基于OpenAI的预过滤器的集成对于减轻实际使用过程中的故障起到了决定性作用。该过滤器在验证叶片存在方面的有效性为96.4%,防止了不相关或低质量的图像(例如,手、土壤、模糊背景)进入系统,确保模型的高准确率有效地转化为应用性能。
与功能测试并行,向在真实条件下使用该应用的用户发放了满意度问卷。陈述按1(非常不满意)到5(非常满意)的等级进行评分。结果如表所示。
用户体验评估是与来自瓦乌拉区(秘鲁利马)的五名农民进行的,他们都从事苹果种植。参与者为男性,年龄在36至68岁之间,农业经验从10年到超过30年不等。他们的教育背景从小学到中学不等,虽然他们的正式技术培训有限,但他们具有足够的实际智能手机操作经验,能够操作中端Android设备。两名支持用户协助了过程但未参与问卷。
为了评估可用性,应用了1到5级的问卷来衡量参与者对应用可用性、组织性和使用意愿的感知。回答反映了高水平的接受度和整体满意度。例如,60%的用户强烈同意他们会经常使用该应用来检测苹果作物病害,另外20%表示同意,显示出明确重复使用该工具的意愿。
易用性是评价最高的方面之一。80%的参与者认为该应用易于使用(值5),其余20%也表示同意(值4),表明在导航体验方面意见一致。此外,100%的用户强烈不同意该应用令人困惑或难以使用。这种感知通过陈述“学习使用这个应用既快又容易”得到加强,其中100%给出了正面评价(80%为4级,20%为5级)。
关于应用的视觉和结构组织,结果同样积极:100%的用户强烈同意该应用组织良好且一切都有意义。在技术稳定性方面,所有参与者报告在使用过程中没有遇到崩溃或不一致行为,这是系统功能鲁棒性的一个强有力指标。
一个有趣的点是关于需要技术支持或事先学习的看法。尽管60%的用户同意他们需要学习一些东西才能正确使用该应用,但这些相同的参与者对学习的容易度和速度给予了正面评价。这种对比表明,虽然该应用可能需要一些初步熟悉,但这并不构成有效使用的显著障碍。总体而言,问卷结果证实该应用可靠、易于使用,并且适合没有先进技术经验的用户。
验证过程中获得的结果表明,所提出的移动应用成功实现了其主要目标:使用户能够通过拍摄或上传的图像检测苹果树叶病害。测试案例的总体成功率为95%,反映了从用户界面到分类模型处理的系统各个组件的正确实施。
一个特别显著的结果是与从清晰图像成功检测相关的测试案例的性能,在第二次测试迭代中达到了80%的成功率。在第一次迭代中,该比率仅为40%,揭示了模型在病害检测能力上的初始局限性。作为回应,在训练数据集中加入了两个额外的类别:白粉病(一种常见的叶部病害)和红蜘蛛(一种在秘鲁苹果作物中广泛存在的害虫),基于SENASA的记录和一位受访用户(Macedonio)的建议。此外,还集成了基于OpenAI API的预过滤器,以确保上传的图像确实描绘植物叶片。这些改进显著优化了App2模型, notably enhancing its usability in real-world scenarios。
从用户体验的角度来看,问卷结果表明了对该应用的积极接受。参与者认为该应用易于使用,结果呈现清晰,并且非常适合其预期目的。此外,所有用户都表达了再次使用该应用的意愿, reinforcing its practical potential in agricultural settings。尽管一些回答指出需要初步学习,但这并未对系统可用性的整体感知产生负面影响。
在整个移动应用的开发和验证过程中获得的结果表明,所提出的解决方案对于检测苹果树叶病害是有效的。将混合模型集成到一个易于访问的移动环境中,使用户能够直接从其设备拍摄或上传的图像中获得快速且易于理解的诊断。测试案例总体成功率达95%,加上用户的积极反馈,可以得出结论,该应用在真实农业环境中也显示出很高的采用潜力。
模型性能的改进,从清晰图像检测案例的40%提高到80%,突显了使模型适应真实田间条件的重要性。加入了白粉病(一种病害)和红蜘蛛(一种害虫)等额外类别,这两者在秘鲁都很常见,增强了模型准确识别相关视觉症状的能力。包含用于验证图像中叶片存在的过滤器也是一个关键改进,因为它避免了不必要的处理并减少了检测错误。总之,这些技术决策增强了应用的实际效用。
对于未来的工作,建议扩展模型类别数量以包括更多与苹果种植相关的病害和害虫,特别是在秘鲁背景下流行的那些。此外,建议开发一个具有离线功能的版本,使该应用能够在没有互联网连接的情况下运行,从而使其在农村地区更易访问。还建议集成地理定位功能,记录图像捕获时作物的位置,这将允许生成对可追溯性、发病率绘图和未来预警系统有用的空间信息。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号