
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于原型网络的开放世界植物物种与病害新颖类别发现方法研究
【字体: 大 中 小 】 时间:2025年05月19日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
本研究针对开放世界场景中植物物种与病害识别存在的未知样本分类难题,提出了一种融合原型网络与知识蒸馏的新型框架。通过构建已知与未知类别的特征空间关系,采用距离度量替代传统线性分类器,在Herbarium19和Plant Village数据集上实现新类别识别准确率提升1%-30%,为智慧农业中的未知病害监测和入侵物种识别提供了创新解决方案。
随着全球人口预计在2050年达到91亿,农业智能化成为保障粮食安全的核心议题。当前深度学习在植物物种与病害识别中取得显著进展,但现有模型面临封闭集假设的致命缺陷——将未知类别强行归类为已知类别,可能导致入侵物种误判或新型病害漏检。传统开放集识别(OSR)仅将未知样本标记为"unknown",这种粗粒度处理方式造成信息浪费,无法满足实际农业场景中对新型威胁精准分类的需求。
针对这一挑战,来自韩国的研究团队在《Engineering Applications of Artificial Intelligence》发表的研究中,创新性地将原型网络(Prototype Network)引入植物新颖类别发现(NCD)领域。该研究通过构建基于DINO-v2预训练模型的双分支框架,利用知识蒸馏损失优化类别空间关系,在保持已知类别识别能力的同时,实现了对未知植物病害和物种的细粒度分类。实验表明,该方法在Herbarium19植物标本和Plant Village病害数据集上,新类别识别准确率最高提升达30%,为农业开放世界场景的智能监测树立了新基准。
关键技术方法包括:1) 采用DINO-v2预训练视觉Transformer作为特征编码器;2) 设计基于距离度量的原型分类头替代传统线性分类器;3) 构建知识蒸馏框架平衡已知/未知类别学习;4) 利用UMAP可视化验证特征空间紧密度。研究使用Herbarium19的45,000+植物标本和Plant Village的54,000+病害图像作为基准数据集。
原型与线性分类头对比
通过可视化分析发现,传统线性分类头在10类番茄病害数据中产生13个特征簇,存在类间距离小于类内距离的问题。而原型网络通过最小化样本与原型向量距离,形成更紧凑的簇结构,为未知类别的伪标签初始化提供优势。
方法有效性验证
在六种不同数据划分方案下,原型网络在Herbarium19上平均新类别准确率达67.2%,较UNO基准方法提升12.4%。特别在细粒度病害识别任务中,对叶霉病等视觉相似病害的区分度提升显著。
开放度影响分析
研究定义开放度(Openness)为1-√(2Cl/(2Cl+Cu)),实验表明当开放度>30%时,原型网络的性能优势更为突出,证实其对复杂开放场景的适应性。
该研究突破性地解决了植物智能监测中的三大难题:1) 通过特征空间直接建模实现已知-未知类别关系量化;2) 利用原型向量距离度量克服线性分类器的语义空间局限;3) 首次建立植物NCD任务的评估基准。尽管存在新颖类别数量需预设的局限,但提出的框架为后续研究提供了重要范式。研究成果可直接应用于农田病害实时监测系统和植物检疫中的入侵物种识别,推动农业智能化向开放世界场景迈进。
生物通微信公众号
知名企业招聘