基于领域自适应的知识驱动型植物病害分类与严重度分级统一框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Plant Phenomics》：A Knowledge-Driven Unified Framework for Plant Disease Classification and Severity Grading via Domain Adaptation

【字体：大中小】 时间：2026年06月09日 来源：Plant Phenomics 6.4

编辑推荐：

　　植物叶片病害分类与严重度分级对于精准农业至关重要，能够支持及时干预与优化管理。现有模型由于标签空间固定且对植物表型的表征能力有限，往往难以识别此前未见的病害类别。为解决这些挑战，研究人员提出了一种知识驱动的植物病害分类与严重度分级统一框架。该框架中的通用知识学

植物叶片病害分类与严重度分级对于精准农业至关重要，能够支持及时干预与优化管理。现有模型由于标签空间固定且对植物表型的表征能力有限，往往难以识别此前未见的病害类别。为解决这些挑战，研究人员提出了一种知识驱动的植物病害分类与严重度分级统一框架。该框架中的通用知识学习器从有标注数据中整合植物物种、病害类别和严重度水平的基础特征，构建可迁移的表征空间。该模块采用多层次对比学习策略，同时捕获全局语义表征与细粒度病斑模式。在此基础上，跨域自适应模块借助教师-学生框架，结合低秩适配（LoRA），利用大规模无标注数据桥接域内与域外特征空间。同时，对比特征库支持基于相似性的推理，并在推理阶段无需重新训练即可实现标签空间的灵活扩展。研究人员在Leaf-CG大规模数据集上对该方法进行了评估，该数据集包含441,448幅图像，覆盖59种植物、373种病害类型和4个严重度等级。实验表明，该框架优于现有基线方法，在域内条件下实现了94.9%的病害分类准确率和90.6%的严重度分级准确率。在域外条件下，该方法在开放集设置中实现了82.1%的真阳性率（TPR），显示出较强的泛化能力和实际植物病害管理应用潜力。代码与数据集可获取于https://www.uniplantcg.samlab.cn。

该论文发表于《Plant Phenomics》，围绕植物叶片病害识别在真实农业场景中的两类关键瓶颈展开：其一，传统深度学习模型多依赖固定分类头和封闭标签空间，面对新出现的植物-病害组合时往往只能误判或归为未知类，难以给出可操作的病害类型与严重度信息；其二，现有研究虽然在受控条件下能够取得较高识别精度，但一旦进入田间环境，光照变化、背景复杂、采集设备差异以及植物表型多样性都会显著削弱模型稳健性。与此同时，现代科学植保不仅需要知道“患了什么病”，还需要判断“病到什么程度”，因此将病害分类与严重度分级纳入同一框架，具有直接的实践价值。正是在这一背景下，研究人员提出了一个知识驱动的统一框架，希望通过结构化知识组织、对比式表征学习和跨域适应机制，提升模型对已知类别、未知类别以及跨场景数据的综合处理能力。

在技术方法上，研究主要包括以下几个关键环节。首先，研究人员构建了Leaf-CG数据集，样本来源覆盖59种植物、373种病害类型，共441,488幅图像，并结合农业专家制定四级严重度标准。其次，在模型层面设计通用知识学习器（CKL），以多层次对比学习（MLC）联合学习植物种类、病害类别和严重度的共享语义与局部病斑特征。再次，利用跨域自适应器（CDA）在无标注域外数据上开展教师-学生式表示对齐，并以低秩适配（LoRA）提升参数高效迁移能力。最后，构建植物、病害和严重度三个对比特征库，实现基于相似性的推理和标签空间扩展。

**Leaf-CG Dataset**
研究人员首先指出，现有多数植物病害数据集缺乏严重度标注，难以支持病害分级任务。因此论文构建了Leaf-CG数据集，既可用于病害分类，也可用于严重度分级。该数据集覆盖59种植物、373类病害，并为每幅图像标注0至3级严重度，对应约0%、≤10%、10%至40%、40%以上受害叶面积。通过至少3位农业专家独立审核及随机抽检、交叉验证，保证了标注一致性。该结果表明，研究建立了一个兼具规模、多样性和多任务属性的新基准，为后续模型训练与评估提供了基础。

**Contrastive Library**
在数据组织层面，研究人员从训练集中按类别抽取约5%的代表性图像，并按严重度均衡采样，构成对比特征库。基于同一批图像建立植物对比库、病害对比库和严重度对比库，仅标签体系不同。通过这一设计，模型在不改变网络结构的前提下，即可面向不同任务完成特征比对和类别匹配。该部分结果说明，对比库不仅是训练辅助，还承担了推理阶段标签扩展和知识外显化的重要作用。

**Common Knowledge Learner**
CKL是第一阶段核心模块，负责从有标注数据中学习植物种类、病害类别和严重度等级的基础表征。与传统全连接分类头不同，CKL将识别任务转化为嵌入空间中的相似性学习。其核心多层次对比模块同时计算全局语义表示与局部病斑块表示之间的相似性，并通过自适应权重突出信息量更高的局部区域。结合交叉熵损失与三元组对比损失后，模型既能保持类间分离，也能保留严重度变化下的类内判别力。该部分说明，研究人员通过层级化对比学习构建了更适合植物病害和严重度联合建模的特征空间。

**Cross-Domain Adapter**
为应对域偏移问题，研究人员进一步提出CDA模块。该模块以教师-学生框架为基础，在冻结主干权重的前提下，仅更新学生分支中的LoRA参数，并利用指数滑动平均（EMA）更新教师分支。通过局部裁剪与全局裁剪之间的一致性约束，以及基于KL散度的分布对齐，模型得以在无标注域外数据上学习更稳定的域不变表示。最终再将教师侧LoRA参数融合回主干网络，用于推理。研究结论表明，这种参数高效的跨域适配方式能够在保留域内知识的同时改善对新域样本的适应性。

**Quantitative Comparisons with the Baselines**
定量实验表明，该方法在多项任务上优于现有监督式模型和开放集模型。域内条件下，框架在病害分类上达到94.9%准确率，在严重度分级上达到90.6%，综合准确率为82.8%；域外条件下综合准确率为54.7%；开放集场景下真阳性率（TPR）达到82.1%，显著高于PALM、DHE和DOS等方法。统计检验进一步说明其相对最强基线的提升具有显著性。该结果证明，知识驱动的对比式统一框架兼具高精度与较强泛化能力。

**Qualitative Comparisons with the Baselines**
可视化结果显示，在植物分类任务中，该方法更关注完整叶片结构；在病害识别中，更准确聚焦病斑位置及范围；在严重度分级中，既关注病斑也保留整叶上下文，从而更有利于判断受害面积比例。与多种基线相比，其注意区域更符合实际诊断需求。这表明模型所学习到的表征具有更好的任务一致性和可解释性。

**Impact of Backbone Architectures**
消融实验比较了多种主干网络后发现，集成在CKL中的ViT在域内和域外任务中整体表现最佳，并在训练曲线上表现出更快收敛和更低损失。该结果支持研究人员选择Transformer架构作为特征提取主干，说明其在跨域病害表征方面具有优势。

**Impact of Cross-domain Fine-tuning**
针对CDA阶段的微调策略比较显示，LoRA微调优于不微调和全量微调。LoRA在域内综合准确率上达到82.8%，在域外达到50.8%，并在t-SNE可视化中形成更紧致且可分的特征簇。相较之下，全量微调虽然压缩了簇结构，但引入了同类分裂和类间边界模糊的问题。该结果说明，LoRA更适合在保持原有知识的同时进行跨域适应。

**Impact of Contrastive Library Size**
当对比库样本量分别缩减30%、60%和90%时，模型性能整体下降，尤其是域外任务和病害识别任务受影响更明显。该实验表明，对比库的规模与多样性直接关系到参考特征的充分性，也是模型处理未知域和未知类别的重要支撑。

**Effect of Stage-wise Fine-tuning on Generalization to Unseen Categories**
在第一阶段和第二阶段均未见过的新植物、新病害类别上，第一阶段模型已取得较高植物与病害准确率，而LoRA阶段微调后进一步将综合得分提升至64.5%，优于全量微调模型。结果表明，分阶段训练结合LoRA适配，在保留基础知识与拓展未知类别泛化之间实现了较好平衡。

**Effect of Label Supervision on Out-of-domain Data**
与完全监督方案相比，仅依赖域内标注、在域外使用无标注自适应的两阶段方法，域外综合性能仅从59.9%下降到51.7%。这一结果说明，即使缺乏域外人工标注，所提框架依然能够通过分布对齐获得较为接近的性能，具有较高现实应用价值。

**Computational Efficiency and Inference**
在15,007张测试图像与93,482张对比库图像的设定下，单张图像平均推理时间为0.00977秒，GPU峰值显存占用为1067.38 MB，CPU内存占用为8959.76 MB。结果说明，该方法在大规模库检索场景下仍保持较好的推理效率和可部署性。

在讨论部分，论文强调该框架以统一架构分别处理植物分类、病害识别和严重度分级，兼顾了任务扩展性、开放集识别能力和相似样本可追溯性。其主要创新在于：以对比特征库替代固定分类头，使标签空间能够通过增加代表样本直接扩展；以CDA解决采集设备、背景和光照差异造成的跨域问题；以知识驱动方式组织表征而非单纯依赖参数化分类器。论文同时指出，方法仍依赖高质量对比库，多任务独立权重管理会增加系统复杂性，极少见或全新病害仍然具有挑战。但这些限制并未削弱其在智能植保中的应用潜力。

研究结论部分可译为：本研究提出了一种知识驱动的植物病害分类与严重度分级统一多任务框架，旨在应对领域偏移以及未见病害类别识别等挑战。随着真实场景下植物病害监测复杂性的提升，该方法能够为新的未知病害类型提供可无缝适应的解决方案。该框架采用双分支对比式设计，可同时捕获全局语义上下文与细粒度病斑线索，从而提升模型在不同植物种类和病害类型之间的泛化能力。模块化架构使其能够便捷适配植物种类识别、病害识别和严重度分级任务，仅需更新标签模式与任务特异权重，而无需修改网络结构，因此具有良好的可扩展性和实际部署价值。基于约441,488幅标注图像构建的Leaf-CG数据集评估结果表明，该框架取得了先进的准确率和较强的跨域泛化能力，在真阳性率（TPR）和总体准确率上的提升说明其能够有效应对域外条件，是面向智能植物健康监测的可扩展方案。本研究也为未来开放集识别、长尾类别适配和可解释人工智能（AI）植物病害诊断研究奠定了基础。

联系信箱：

粤ICP备09063491号

热点排行