编辑推荐:
本文全面综述了玉米叶片病害检测、分割和分类(MLDDSC)的研究进展,涵盖数据集、图像处理、特征提取、评估指标、机器学习(ML)和深度学习(DL)架构等方面。指出当前研究的优势与不足,并提出未来研究方向,为相关领域提供了重要参考。
一、引言
玉米作为全球重要的谷类作物,在食品、饲料和生物燃料等领域应用广泛。其产量和质量受多种因素影响,其中病害是导致减产的重要原因之一。例如,1988、1995 和 2012 年美国玉米因严重干旱减产,2019 和 2021 年则受病虫害影响产量下降。像南方玉米叶枯病(SCLB)、北方玉米叶枯病(NCLB)等,会给玉米生产带来严重损失。
传统的植物病害检测方法,如人工肉眼检查和显微镜检测,存在效率低、易出错、难以大规模应用等问题。随着计算机视觉技术和机器学习(ML)、深度学习(DL)的发展,为玉米叶片病害检测、分割和分类(MLDDSC)提供了新的解决方案。本文通过对 2020 - 2024 年间 82 篇相关文献的研究,探讨了 MLDDSC 的最新进展、面临的挑战及未来研究方向。
二、玉米叶片病害概述
玉米易受病毒、真菌和细菌等多种病害侵袭。常见的玉米叶片病害有北方玉米叶枯病(NCLB)、南方玉米叶枯病(SCLB)、普通锈病(CR)等。这些病害在不同地区发生,症状各异,给玉米生产带来了严重威胁。在计算机系统和人工智能(AI)出现之前,植物叶部病害检测主要依靠视觉田间检查、实验室实验等传统方法,这些方法存在局限性。而 AI 系统在植物病害检测方面表现出更高的效率,能够节省时间和成本。
三、数据集和图像预处理
3.1 数据集
数据集的选择对模型性能至关重要,不合适的数据集可能导致模型性能不佳、出现法律和伦理问题。目前,玉米叶片病害的数据集来源广泛,包括公共和私人存储库、政府档案等。常见的数据集有 PlantVillage、Kaggle 等,不同数据集在图像数量、类别和来源上存在差异。
3.2 图像预处理
图像预处理是在将图像用于各种应用之前,对数字图像应用一系列技术和操作。其目的是为了提高图像质量,便于机器学习模型进行有效学习。常见的预处理技术包括归一化,它将像素值缩放到指定范围,确保图像强度均匀,有助于模型训练的稳定性和收敛性;直方图均衡化,通过重新分配像素强度来提高图像整体对比度,增强细节;噪声 reduction,如使用高斯模糊等技术平滑图像,减少随机变化的影响。
3.3 图像增强
图像增强是通过对现有图像应用不同变换来增加训练图像的多样性。这一技术对于扩大训练图像规模、减少过拟合、提高模型鲁棒性和解决类别不平衡问题具有重要意义。图像增强技术可分为几何变换、强度和颜色调整、结构变换、补丁级变换和混合技术等。
3.4 特征提取技术
特征提取是将原始数据转换为一组可被 ML 算法处理的特征的过程,有助于降低数据维度,提高模型效率。在图像领域,常见的特征提取技术包括颜色直方图、基于梯度的特征、纹理描述符、直方图定向梯度(HOG)、尺度不变特征变换(SIFT)、卷积神经网络(CNNs)、主成分分析(PCA)和视觉词袋(BoVW)等。
四、检测、分割和分类
4.1 目标检测
目标检测旨在识别图像中所有对象的存在,并使用边界框基于感兴趣区域(ROI)描绘其位置。输出包括对象的分类标签和相应的边界框。该技术在自动驾驶、医学影像分析等领域有广泛应用,但相比分类任务,需要更多的计算资源。
4.2 分割
分割是计算机视觉中的一项基本任务,它基于详细的像素级信息将图像划分为不同的段或区域。每个像素被分类,以区分对象和背景元素,精确描绘对象的轮廓和形状。分割在土地利用分类、文本区域检测等方面发挥着重要作用。
4.3 分类
分类专注于识别和分类图像中的对象或场景,为理解图像内容提供初步信息。与目标检测和分割不同,分类为整个图像或指定的感兴趣区域分配单个标签或类别。该技术在教育、金融、网络安全等领域有重要应用。
4.4 评估指标
在 ML 和 DL 中,评估指标用于衡量模型在特定任务上的性能。常见的评估指标包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)、特异性(Specificity)、假阳性率(FPR)、F 度量(F-Measures)、Top-k 准确率、平均精度(AP)、平均平均精度(mAP)、接收者操作特征曲线(ROC)、曲线下面积(AU-ROC)、交并比(IoU)、Dice 相似系数(DSC)、兰德指数(RI)、Harsdorf 距离和马修斯相关系数(MCC)等。不同的评估指标适用于不同的任务和数据特征。
五、机器学习在图像数据中的应用
5.1 机器学习技术在 MLDDSC 中的应用
随着植物叶片病害检测技术的发展,ML 算法在玉米叶片病害检测中的应用越来越广泛。常用的 ML 算法包括支持向量机(SVM)、随机森林(RF)、深度森林(DF)、K 近邻(KNN)、决策树(DT)和朴素贝叶斯(NB)等。研究表明,AlexNet 与 SVM 结合表现出色,Deep Forest 在 ML 算法中性能优异。此外,实施鱼群优化(FSO)的 SVM 可提高准确率。
六、深度学习在图像数据中的应用
6.1 深度学习技术在 MLDDSC 中的应用
深度学习在玉米叶片病害检测中也取得了显著成果。常用的 DL 架构包括 AlexNet、ResNet、VGGNet 等。研究发现,预训练的 GoogleNet 在 NCLB 分类中表现最佳,YOLOv8n 在检测任务中准确率最高。此外,联邦学习(FL)可提高异构领域的隐私性,CNN 模型与 FL 范式结合在安全方面表现出色。
6.2 定制深度学习技术
定制深度学习算法通常涉及对模型的架构、参数、训练过程等进行直接更改或修改。通过调整架构,如改变层数、激活函数和层连接方式;调整参数和超参数,如初始权重、学习率和正则化项;设计特定任务的损失函数;以及进行量化和剪枝等操作,可以使模型更好地捕捉数据中的模式,提高准确性、效率和泛化能力。
6.3 定制技术在 MLDDSC 中的应用
在 MLDDSC 中,研究人员采用了多种定制的 DL 算法。大多数研究使用 Plant Village 数据集,重点关注架构定制,如修改现有架构或设计新架构。同时,也有研究关注正则化技术、损失函数设计等。评估参数包括精度、召回率、F1 分数、mAP、IoU 等,以及训练时间、模型大小和 FLOPs 等,用于衡量模型的效率和复杂性。
6.4 集成和迁移学习
集成学习通过整合多个模型来提高预测准确性和稳定性,常见的方法有装袋(Bagging)、提升(Boosting)和堆叠(Stacking)。迁移学习则是将在一个任务上训练的模型应用于相关但不同的任务,可节省时间和资源。在 MLDDSC 中,这两种技术都有广泛应用。
6.5 集成和迁移技术在 MLDDSC 中的应用
在 MLDDSC 中,集成学习和迁移学习取得了良好效果。如 Bansal 和 Kumar 通过广泛的预处理和数据增强技术,结合贝叶斯优化微调 AlexNet DCNN 模型,在 Plant Village 数据上获得了 96.05% 的准确率。在迁移学习方面,研究人员使用预训练模型在 ImageNet 数据集上进行训练,然后在目标数据集上进行微调,取得了不错的成果。
6.6 轻量化方法
轻量化方法旨在创建资源高效、计算量小、内存占用少的模型,以适应资源受限的环境。常用的技术包括减少模型大小、量化和模型压缩等。轻量化模型具有推理速度快、内存需求低等优点,但在模型大小和性能之间需要找到平衡。
6.7 轻量化方法在 MLDDSC 中的应用
许多研究致力于开发轻量化模型用于玉米叶片病害检测。这些模型采用了多种技术,如减少参数、优化架构等。例如,Zeng 等人开发的 LDSNet 模型在玉米叶病数据集上实现了 95.4% 的准确率和较低的参数大小,表现优于其他模型。
七、叶片病害 / 损伤的严重程度测量
叶片病害严重程度测量是植物病理学的重要部分,有助于了解病害的影响程度、监测病害进展并制定管理策略。常用的测量方法包括视觉评估、图像加工、光谱检查和遥感疾病指数测量等。结合 ML 和 DL 方法,可以创建更准确的严重程度测量系统。测量指标包括患病叶面积(DLA)、准确率、精确率、召回率和敏感性指数(SI)等,以及植被指数如相对增强归一化差异植被指数(RENDVI)、植物衰老反射指数(PRI)和叶片相对病害严重程度指数(LRDSI)等。
八、讨论
8.1 基于机器学习
在机器学习方面,SVM 是研究人员常用的算法,通过优化技术可提高其准确性。优化 ML 算法的关键在于自动化特征工程、提供可扩展的训练和推理基础设施以及创建强大的数据管道。
8.2 基于深度学习架构
在深度学习架构中,AlexNet 是常用的 DL 架构之一,具有重要地位。具有视觉解释的 DL 算法,如 Grad-CAM 和注意力机制,在评估指标和降低错误率方面表现出色。定制 DL 算法时,研究人员主要采用组合方法,对架构、参数和损失函数进行修改,以提高模型性能。
8.3 基于自监督架构
自监督学习通过利用数据中的辅助或 pretextual 任务学习有意义的表示,减少对大量标记数据的依赖,提高模型的鲁棒性和适应性。研究表明,自监督学习在植物病害检测中具有潜力,可与监督学习相媲美。
8.4 评估指标
在评估指标方面,疾病叶面积、敏感性指数和总体准确率是常用的指标。随着无人机成像技术的发展,如高光谱和多光谱成像,为提高玉米病害检测和严重程度评估提供了新的可能性。此外,不同的评估指标在不同的任务和模型中具有不同的重要性。
8.5 对关键研究问题的反思
本文回顾了 8 个关键研究问题(RQs)。对于 RQ1,介绍了现有的数据集、图像预处理和特征提取技术;RQ2 讨论了评估指标;RQ3 列出了常用的预训练模型;RQ4 阐述了 DL 模型的定制方法;RQ5 介绍了集成和迁移学习模型;RQ6 总结了轻量化模型的发展;RQ7 探讨了病害严重程度的测量;RQ8 则在后续章节中提出了未来研究方向。
九、未来研究方向
9.1 收集多样化和多维度的数据集
为了开发可靠的模型,需要收集多样化的数据集,包括不同背景条件下的图像,并涵盖更多的病害类别。目前的数据集在多样性方面存在不足,且缺乏针对早期疾病检测、营养缺乏和高光谱图像的数据集。开发这些新维度的数据集可能是农业深度学习领域的潜在突破。
9.2 计算机视觉在多病害检测中的任务
利用两阶段模型和实例分割技术,实现对玉米叶片上多种病害以及病害与营养缺乏同时存在情况的自动检测和分类,这是当前研究尚未充分探索的领域。
9.3 开发农民友好型应用程序
现有的移动应用在植物叶片病害检测和分类方面存在不足,需要开发更强大的应用程序,以最低的资源消耗实现最高的效率。
9.4 玉米叶片病害严重程度的测量
目前对玉米叶片病害严重程度的测量研究不足,需要更多关于自动严重程度测量和监测系统的研究,特别是应用视觉 transformers 等新技术。
十、结论
本文综述了玉米叶片病害检测、分割和分类的计算机视觉方法的最新研究进展。传统预测方法存在挑战,而 ML 和 DL 技术为病害预测提供了有效解决方案。分析发现,多数研究集中于分类任务,在多任务分类方面存在不足。未来应加强这方面的研究,以提高玉米病害检测和分类的效率和准确性。