基于均值教师网络的植物物种与病害动态识别新方法PDR:大规模植物数据集LSPD的构建与验证

《Engineering Applications of Artificial Intelligence》:Dynamic recognition on plant species and diseases using mean teacher network

【字体: 时间:2025年12月22日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本研究针对农业实践中植物病害识别面临已知病害分类与未知病害发现的动态挑战,提出植物相关动态识别(PDR)框架。通过均值教师网络架构,结合DINOv2预训练和植物特异性数据增强策略,在构建的大规模植物病害数据集(LSPD)上实现已知类别分类准确率93.44±0.02%,新类别发现准确率77.77±0.03%,较现有方法提升显著,为农业动态环境下的病害监测提供新范式。

  
在智慧农业蓬勃发展的今天,植物病害的早期识别与精准诊断对保障粮食安全至关重要。然而,田间环境中的病害识别面临着一个根本性挑战:农业生产是一个动态演进的过程,新的病害会不断出现,而传统深度学习模型通常只能在固定类别的封闭数据集上进行训练,无法有效识别训练集中未曾见过的病害类别。现有方法大多将未知病害简单归为统一的"未知"类别,或假设未标注数据仅包含全新类别,这与农业实际应用场景存在显著差距。
针对这一难题,发表于《Engineering Applications of Artificial Intelligence》的研究提出了一种创新性的植物相关动态识别(Plant-relevant Dynamic Recognition, PDR)框架。该研究首次将植物病害识别问题构建为一个广义类别发现(Generalized Category Discovery, GCD)任务,旨在同时解决已知类别的分类和未知类别的发现这一双重挑战。研究人员指出,农业场景的特殊性在于,未标注数据中既包含已知类别样本,也可能包含需要被发现和归类的新病害类别,且新病害在视觉特征上可能与已知病害高度相似,这大大增加了识别难度。
为支撑这一研究,团队构建了迄今为止最全面的大规模植物相关数据集LSPD,涵盖9种植物物种的50种病害类别,创新性地包含了叶部和果实病害的综合数据,其累积光谱梯度(CSG)复杂度评分达到21.74,远高于其他现有数据集。该数据集的一个显著特点是同一病害可能出现在不同作物上,而同一作物的健康与患病器官可能共存于同一图像中,高度模拟了真实农田环境的复杂性。
研究采用的核心技术方法包括:基于均值教师(Mean Teacher)框架的双网络架构,其中教师网络通过指数移动平均(EMA)更新参数,为学生网络提供稳定的伪标签指导;利用DINOv2预训练的Vision Transformer(ViT)作为骨干网络进行特征提取;针对不同数据集特性设计了三层级的数据增强策略;结合有监督对比学习和自监督对比学习的多目标优化框架。
研究结果方面,在五个植物病害数据集上的系统评估表明,PDR方法在多项指标上显著优于现有最先进方法。在LSPD数据集上,PDR实现了71.45%的总准确率,其中已知类别准确率达88.16%,新类别发现准确率为52.34%,相比SimGCD方法提升明显。特别值得注意的是,在IVADLTomato和CottonWeed数据集上,PDR在新类别发现方面分别实现了95.37%和80.70%的准确率,较基线方法提升超过20个百分点。
通过细致的消融实验,研究人员验证了各技术组件的贡献。数据显示,适当的增强策略与对比学习的结合对性能提升至关重要:在IVADLT数据集上,同时使用对比学习和专用数据增强可使新类别识别准确率从69.11%提升至95.37%。教师网络的EMA更新策略也比直接参数共享更能提高伪标签质量,特别是在处理类别相似度高的复杂数据集时优势明显。
研究还深入分析了"开放性"(openness)对模型性能的影响,发现当已知类别数量减少(即开放性增加)时,新类别的识别准确率会相应下降,这表明从已知类别中学习到的表征知识对新类别发现具有重要迁移价值。然而有趣的是,这种性能下降主要影响新类别识别,对已知类别的分类性能影响相对较小。
可视化分析进一步揭示了PDR方法的优势。t-SNE降维图显示,该方法能够在特征空间中将已知类别和新类别实现良好分离,且新类别内部也形成了清晰的聚类结构。与SimGCD方法相比,PDR在特征空间中实现了更紧凑的类内分布和更显著的类间分离,特别是在IVADLTomato和LSPD等复杂数据集上,类别间的重叠现象显著减少。
讨论部分指出,植物病害动态识别的主要挑战来自两个方面:一是已知病害与新发病害在视觉特征上可能高度相似;二是田间环境采集的图像存在多尺度、复杂背景、多个器官共存等干扰因素。PDR框架通过均值教师架构的稳定伪标签生成能力和针对植物图像特点设计的数据增强策略,有效缓解了这些挑战。研究表明,基于大规模预训练视觉Transformer的表示学习能力,结合任务适配的训练策略,可以显著提升模型在开放动态环境中的泛化能力。
该研究的创新价值在于将广义类别发现范式成功应用于植物病害识别领域,解决了农业实际应用中模型需要同时处理已知和未知病害的现实需求。提出的LSPD数据集为领域研究提供了重要的基准平台,其规模和复杂性均超过现有公开数据集。方法论上,针对植物图像特点设计的增强策略和训练技巧为类似领域的动态识别问题提供了有益借鉴。
研究人员也坦诚指出了当前工作的局限性:模型尚未针对边缘设备进行优化,实时适应性验证不足,缺乏田间实际部署评估,且仅处理了视觉模态数据。未来工作将聚焦于模型压缩与边缘部署、增量学习机制设计、多模态数据融合等方向,推动研究成果向实际农业应用转化。
从更广阔的视角看,这项研究不仅对智慧农业中的病害监测预警具有直接应用价值,其提出的动态识别框架也可迁移至医学影像分析、工业质检等其他需要处理类别动态增长场景的领域,为开放环境下的细粒度视觉识别问题提供了新的技术路径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号