基于增量学习的番茄表型性状检测优化:YOLOv11与注意力机制的综合评估

【字体: 时间:2025年08月23日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  为解决番茄作物表型分析中数据非静态性和模型泛化能力不足的问题,研究人员开展了基于YOLOv11的增量学习框架研究。通过系统评估不同版本YOLO检测器,结合卷积块注意力模块(CBAM)和混洗注意力(SA)机制,建立了增量学习流程。结果显示该方法使mAP@0.5提升1.36%,F1分数提高1.1%,推理速度加快19ms,并在小样本场景下展现出优异的领域适应能力,为农业表型分析提供了实用解决方案。

  

在全球气候变化威胁粮食安全的背景下,番茄作为全球消费量最大的水果之一,其产量预计将在未来几十年内大幅下降。传统表型分析方法依赖人工视觉评估,效率低下且难以应对大规模种植需求。虽然高通量表型分析(HTP)平台能产生海量数据,但完全依赖专家评估仍不现实。当前基于深度学习的解决方案面临数据非静态性、模型泛化能力不足等挑战,特别是在处理不同生长阶段、环境条件下的番茄表型特征时表现欠佳。

为解决这些问题,Angelo Cardellicchio等研究人员在《Smart Agricultural Technology》发表研究,系统评估了YOLOv5、YOLOv8和YOLOv11等目标检测算法,并提出创新的增量学习框架。研究采用意大利国家研究委员会智能工业技术与先进制造系统研究所的实验室和田间数据集,通过Hyperband算法优化模型参数,利用EigenCAM可视化决策过程,建立了完整的评估体系。

关键技术方法包括:1)使用LemnaTec Scanalyzer3D系统采集1624×1234分辨率实验室图像和Intel RealSense D435采集1280×720分辨率田间图像;2)将数据集划分为κ个增量子集进行序列训练;3)评估CBAM和SA两种注意力机制在YOLO架构中的效果;4)采用mAP@0.5、F1分数等指标量化性能;5)在NUC设备上测试推理速度验证实用性。

研究结果显示:

  1. 1.

    基准测试表明YOLOv11m达到最佳平衡,mAP@0.5为58.7±1.0%,F1分数62.6%,被选为后续实验基础模型。

  2. 2.

    消融研究发现注意力机制对小模型(YOLOv11s)效果显著(mAP提升1.6%),但对YOLOv11m产生负面影响(mAP降低0.8%),且显著增加计算负担(最高达110.1%)。

  3. 3.

    增量学习策略使YOLOv11m的mAP@0.5提升至60.06±0.2%,F1分数达63.7%,推理速度加快至671.7±16.4ms,同时大幅降低结果波动性。

  4. 4.

    领域适应实验证明,经过增量学习的模型通过微调后,在仅有26张图像的田间测试集上实现55.95%的mAP@0.5,与人工计数结果高度一致。

通过EigenCAM可视化分析发现,增量学习使模型更早聚焦关键特征:在训练初期就关注边缘特征,随着迭代深入逐渐形成对表型性状的精准定位能力,而基准模型则容易分散注意力到背景等无关区域。混淆矩阵分析揭示了当前标注系统的局限性,模型能识别专家遗漏的花朵特征,但也产生了大量次级茎节点等"假阳性"检测。

这项研究的重要意义在于:1)确立了YOLOv11m作为番茄表型分析的最佳基准模型;2)开发出能持续适应新数据的增量学习框架;3)揭示了注意力机制在农业视觉任务中的适用边界;4)证明了跨领域迁移学习的可行性。尽管存在标注质量等限制,该工作为农业表型分析提供了可扩展的解决方案,其增量学习策略也可推广至其他领域。未来研究可结合拓扑信息进一步提高检测特异性,并探索更高效的注意力实现方式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号