编辑推荐:
为解决番茄叶部病害识别难题,研究人员构建 DWTFormer 模型,大幅提升识别准确率,助力农业发展。
在农业领域,番茄作为全球众多国家的重要战略资源,其产量和质量却深受各类病害的威胁。叶部病害往往是番茄患病的首要表现,及时且准确地识别这些病害对于番茄种植的有效病害管理至关重要。传统依靠植物保护专家或经验丰富农民的人工识别方法,不仅耗时费力,还极易受到主观因素的影响,产生偏差和误判。尤其是番茄叶部病害存在显著的类内变异性和类间相似性,同一病害在不同感染阶段症状差异大,多种病害又可能呈现相似的病理特征,这使得传统识别方法更加难以应对。随着科技的发展,机器学习和深度学习方法逐渐应用于作物叶部病害识别领域。然而,机器学习方法严重依赖人工设计的特征提取算法,在面对番茄叶部病害种类繁多、特征分布复杂的情况时,效率较低。深度学习方法虽然在简单特征分布数据集上表现出色,但在复杂数据集上,由于主要从单一空间域提取病害特征,容易忽视图像中的高频纹理细节,导致识别准确率下降。为了攻克这些难题,西北农林科技大学的研究人员开展了一项关于番茄叶部病害识别的研究,提出了一种基于频率 - 空间特征融合的模型 DWTFormer(A frequency - spatial features fusion model for tomato leaf disease identification),相关研究成果发表在《Plant Methods》上。
研究人员为开展此项研究,主要运用了以下关键技术方法:首先,收集了多个数据集,包括来自 Kaggle 的番茄叶部病害数据集、自建数据集以及 AI Challenger 2018 和 PlantVillage 数据集等,这些数据集涵盖了多种作物的叶部病害样本,用于模型训练和评估。其次,设计了 Bneck - DSM 模块、双分支特征映射网络(DFMM,Dual - domain features mapping model)和基于动态交叉注意力的双域特征融合模型(MDFF - DCA,Multi - scale, dual - domain features fusion model based on dynamic cross - attention)等,通过这些模块和模型实现对病害特征的提取和融合。
在研究结果方面:
- 模型性能表现:在番茄叶部病害数据集上,DWTFormer 的识别准确率高达 99.28%,优于 MobileNetV3、Swin Transformer 等大多数现有主流模型。在 AI Challenger 2018 和 PlantVillage 数据集上,也分别取得了 96.18% 和 99.89% 的识别准确率。这表明该模型在不同数据集上都具有良好的识别能力,能够有效应对番茄叶部病害的类内变异性和类间相似性问题。
- 模型泛化性验证:通过在自建数据集以及 CUB 200、Stanford Dogs 和 CIFAR10 等跨域数据集上进行实验,发现 DWTFormer 在识别其他作物叶部病害以及处理复杂背景和高类内变异的图像时,均展现出良好的泛化性。在自建数据集中,其识别准确率达到 97.63%;在 CIFAR10 数据集上,准确率更是高达 96.22%,远超其他对比模型。
- 消融实验结果:通过对 DWFD、MPVT、MFA 和 DFF - DCA 等模块进行消融实验,验证了各个模块在提升模型性能方面的重要作用。例如,引入 DFMM 模块可使识别准确率提高约 3.57%,MDFF - DCA 模块能提高约 2.36% 等。同时,还对不同 Bneck - DSM 数量、激活函数、特征融合次数以及频率和空间域特征通道比进行了实验,确定了模型的最优配置。
- 可视化分析:利用 CAM(Class Activation Mapping)技术对模型进行可视化分析,发现 DWTFormer 在识别具有类间相似性和类内变异性的番茄叶部病害时,能够更准确地聚焦于关键特征区域,减少无关特征的干扰。与其他模型相比,其关注区域更接近人类眼睛的关注点。
- 田间应用测试:开发了基于 Android 的番茄叶部病害识别应用程序 TomatoAPP,并在田间进行了实时识别测试。在不同光照和天气条件下,DWTFormer 在 TomatoAPP 中的平均识别准确率达到 97.22%,平均推理时间为 0.028 秒。不过,强烈光照会对识别性能产生一定影响。
研究结论和讨论部分指出,DWTFormer 通过独特的频率 - 空间特征融合机制,有效降低了类内变异性和类间相似性对番茄叶部病害识别准确率的影响,在多种数据集和实际应用场景中均表现出色。与其他相关研究相比,DWTFormer 在处理复杂病害特征方面具有显著优势,为作物病害识别提供了新的思路和方法。然而,该研究也存在一定的局限性,如在田间环境中,复杂的背景和光照条件会影响模型的识别准确性。针对这些问题,研究人员提出了未来的研究方向,包括结合 UNet 和 VMamba 设计 U 形 Mamba 进行背景分割,以及设计基于 Retinex 和自适应 BayesShrink 小波阈值法的图像增强算法,以提高模型在田间环境中的适应性和鲁棒性。同时,进一步优化 DWTFormer 的框架,减少模型的参数和计算量,使其更适用于移动设备和资源受限的环境。
综上所述,DWTFormer 模型的提出为番茄叶部病害识别乃至整个作物病害识别领域带来了新的突破,为精准农业的发展提供了有力的技术支持,具有重要的理论和实践意义。