Hort-YOLO:一种具有集成半自动化标注框架的多作物深度学习模型

《Computers and Electronics in Agriculture》:Hort-YOLO: A multi-crop deep learning model with an integrated semi-automated annotation framework

【字体: 时间:2025年11月19日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  精准检测与高效标注:Hort-YOLO农业实时检测模型及半自动标注框架研究。

  本研究围绕农业中复杂光照条件下的目标检测与计数问题展开,提出了一个名为Hort-YOLO的新型模型架构。Hort-YOLO结合了自定义的DeepD424v1主干网络和重新设计的YOLOv4检测头,旨在提升模型在实际农业场景中的性能表现。这一模型的开发背景源于农业自动化对精准识别和分类作物的需求,尤其是在种子萌发、病害识别、果实分级、叶部水力压力监测和果实成熟度评估等环节。在这些任务中,传统的人工检测方式存在效率低、易出错、依赖经验等缺点,尤其是在光照不均、背景复杂和目标遮挡等挑战下,人工标注不仅耗时,还难以保持一致性。因此,开发一个能够高效、准确识别目标的系统显得尤为重要。

### 模型架构与创新点

Hort-YOLO的核心在于其主干网络DeepD424v1,该网络采用模块化和非对称结构,通过不同尺度和并行下采样层提取具有判别力的多尺度全局与局部空间特征。这种设计不仅有助于防止特征感知的丢失,还能够提升模型的识别速度和精度。具体而言,DeepD424v1网络通过逐步减少特征图的空间尺寸,提取从细粒度到粗粒度的细节信息,并生成多样化的空间和通道维度上下文信息。这一过程显著降低了计算复杂度,同时增强了卷积神经网络(CNN)的表示学习能力。Hort-YOLO的模型大小约为260 MB,使其在资源受限的环境中也具备良好的适应性。

在检测头部分,Hort-YOLO采用了重新设计的结构,包含三个检测头和一个并行上采样模块(PUSM)。其中一个检测头连接到PUSM,以更好地捕捉不同尺度的特征,而另外两个检测头则分别连接到不同的空间金字塔池化模块(SPPM)。这种设计特别适用于小目标或密集目标的识别,有助于保留细粒度特征,避免特征冗余,并显著提高检测精度。SPPM模块通过调整最大池化层的尺寸和引入跳连,增强了模型对不同分辨率特征图的处理能力,从而提升了对复杂光照条件下的目标定位能力。Hort-YOLO的检测头使用PReLU激活函数,相比于Leaky ReLU,PReLU在训练过程中可以自动调整超参数α,提供更高的灵活性,从而提升模型的精度、收敛速度和泛化能力。

### 数据集与实验设置

本研究的数据集涵盖了多种作物,包括番茄、柑橘、葡萄和黄瓜等,涉及从种子萌发到果实成熟的不同生长阶段。数据采集采用了多种设备,包括移动设备、数码相机和智能玻璃等,确保了数据的多样性和代表性。为应对类别不平衡问题,研究团队对数据集进行了重新分配,通过随机复制少数类样本并应用数据增强技术(如随机翻转、旋转、缩放和剪切)来平衡各类样本的数量。实验过程中,使用了不同的计算平台进行模型训练,包括配备NVIDIA GeForce RTX 4070 Ti SUPER显卡的PC和配备NVIDIA GeForce RTX 3080 Ti显卡的设备,以验证模型在不同计算资源下的性能表现。

为了评估模型的性能,研究团队采用了一系列标准指标,包括交并比(IoU)、平均精度(mAP)、召回率(Recall)、F1分数和混淆矩阵。其中,mAP和Recall被用来衡量模型的检测能力,而F1分数则用于评估模型在类别不平衡情况下的整体表现。实验结果显示,Hort-YOLO在多个任务中均表现出优异的性能,尤其是在柑橘叶病害识别和葡萄叶水力压力监测任务中,其在验证数据集上的F1分数达到了0.68,mAP0.5和Recall分数分别达到0.77和0.80。此外,Hort-YOLO还能够在每秒15至30帧的范围内进行实时检测,表明其在复杂农业环境中的实用性。

### 半自动标注框架的效率与可靠性

为解决人工标注的效率和成本问题,研究团队还提出了一种半自动标注框架。该框架能够显著减少标注时间,达到传统人工标注的5至6倍,从而提高了监督学习的可扩展性。通过使用D-RISE(检测器随机输入采样解释)方法,研究团队评估了模型在标注任务中的表现,并生成了显著性图以解释模型的决策过程。结果显示,Hort-YOLO在不同任务中的标注精度较高,且其显著性图能够准确识别出对预测结果影响最大的图像区域。这种半自动标注方法不仅减少了人工干预,还提升了标注的一致性和准确性,为农业自动化提供了坚实的数据基础。

### 模型性能与未来改进方向

尽管Hort-YOLO在多个任务中表现优异,但研究团队也指出了其在某些方面的局限性。例如,在柑橘果实分级任务中,由于数据集的不平衡,模型的性能受到一定影响。此外,某些任务(如柑橘叶病害识别)中,由于目标尺寸较小且特征不明显,模型在验证数据集上的表现略低于预期。为了进一步提升模型的性能,研究团队计划在未来的工作中增加少数类的数据样本,并优化模型的参数配置和训练策略。同时,研究团队还考虑将模型部署到边缘设备上,以减少对高带宽网络的依赖,提高实际应用中的灵活性和可操作性。

### 实际应用与挑战

Hort-YOLO的实用性在农业实际场景中得到了验证。例如,在番茄生长阶段的监测中,模型能够准确识别从花期到收获期的各个阶段,并以每秒15至30帧的速度进行实时检测。这种性能使得Hort-YOLO能够应用于自动化农业系统,如智能温室和果园管理,从而提高生产效率和质量控制水平。然而,在实际应用中,模型仍然面临一些挑战,如光照条件的不稳定性、目标遮挡以及背景复杂性等。这些问题可能会影响模型的检测精度,尤其是在光照变化较大的情况下,颜色识别可能变得困难。因此,研究团队建议在标注过程中采用更多样化的数据采集方法,并优化模型的适应性,以应对这些实际问题。

### 模型优化与未来展望

为了进一步优化Hort-YOLO的性能,研究团队还探讨了其他可能的改进方向。例如,他们计划在未来的工作中尝试将Swish激活函数替换为Mish激活函数,以探索其在模型主干和检测头中的表现差异。此外,研究团队还考虑引入一致性正则化方法,以提升模型的训练效率和泛化能力。通过这些优化,Hort-YOLO有望在更广泛的农业应用场景中发挥更大的作用,尤其是在需要高精度和高效率的场合。

总的来说,Hort-YOLO的提出为农业中的目标检测与计数问题提供了一种高效且可靠的解决方案。通过自定义的主干网络和重新设计的检测头,该模型在复杂光照条件下依然能够保持较高的检测精度和速度,同时通过半自动标注框架显著降低了标注成本。尽管仍有一些挑战需要克服,但Hort-YOLO的初步实验结果表明,它在农业自动化和智能化方面具有巨大的潜力。未来,随着数据集的进一步完善和模型的持续优化,Hort-YOLO有望成为农业监测和管理的重要工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号