用于稻田环境中检测Pomacea canaliculata卵的对象检测算法
《Frontiers in Plant Science》:Object detection algorithm for eggs of Pomacea canaliculata in a paddy field environment
【字体:
大
中
小
】
时间:2025年11月14日
来源:Frontiers in Plant Science 4.8
编辑推荐:
水稻田中入侵物种Pomacea canaliculata蛋类检测算法优化研究,提出基于YOLOv8n的改进模型,通过多维度动态卷积(ODConv)、Slim-neck架构和可感知范围注意力头(RFAHead)协同优化特征提取与检测精度,在6,783张标注数据集上实现mAP@0.5达96.5%、mAP@0.5:0.95达68.4%,较原模型提升3.3%和4.2%,且在Jetson Nano嵌入式设备上实现113.7 FPS实时检测。
在农业生产中,外来物种对作物质量和产量的影响日益严重,尤其是在中国,*Pomacea canaliculata*(即金蜗牛)的扩散给水稻种植带来了巨大挑战。这种物种不仅具有极强的适应性和繁殖能力,还在全国多个省份形成了稳定的种群,影响范围广泛,不仅威胁到农业、林业、畜牧业和水产养殖等产业,还对生态环境和公共健康构成潜在风险。金蜗牛的卵在稻田中尤为隐蔽,常常受到植物茎叶的遮挡,导致现有的检测方法在识别这类目标时存在较大的困难。因此,提出一种基于YOLOv8n的改进算法,以实现对金蜗牛卵的高效、准确识别,成为保障粮食安全和进行入侵防控的关键技术手段。
为了应对这些挑战,本文提出了一种增强型YOLOv8n算法,主要通过三个方面的改进来提升检测性能:在主干网络中引入“多维动态卷积”(ODConv),优化特征提取能力;在颈部结构中采用“Slim-neck”架构,提高特征处理效率;在检测头部分设计“接收场注意力机制”(RFAHead),进一步提升识别精度。实验结果证明,改进后的模型在mAP@0.5和mAP@0.5:0.95指标上分别比原始YOLOv8提高了3.3%和4.2%。与Faster R-CNN、YOLOv3-tiny、YOLOv5、YOLOv6、YOLOv7-tiny、YOLOv9-t、YOLOv10n和YOLOv11n等模型相比,改进后的模型在mAP@0.5指标上分别高出18.2%、12.4%、5.2%、10.8%、11.6%、5.0%、3.8%和3.4%,在mAP@0.5:0.95指标上则分别高出20.6%、17.5%、8.1%、15.6%、16.1%、7.0%、7.7%和6.5%。这些结果表明,该算法在识别金蜗牛卵方面具有显著优势。
此外,视觉分析进一步验证了改进模型在识别小尺寸和被遮挡目标时的优越性。通过对不同环境下的金蜗牛卵图像进行对比,可以明显发现,改进后的模型在特征学习和识别精度方面均有所提升。这种提升不仅提高了识别的准确性,还增强了模型在复杂田间环境中的适应能力,从而为入侵物种的监测和防控提供了技术支持。
为了构建一个高质量的检测数据集,本文在四川成都市青白江区的雅斗镇进行了实地采集,收集了大量金蜗牛卵图像,并进行了标注处理。采集过程中使用了DJI Phantom 4 Pro无人机和手持设备,图像分辨率分别为5742×3648和3648×2736。通过对不同角度和光照条件下的图像进行采集,确保了数据集的多样性,模拟了金蜗牛卵在不同环境下的真实情况。经过数据增强处理,最终获得了6783张图像,其中包括非遮挡卵和遮挡卵两种类型,用于验证模型在遮挡情况下的检测性能。数据增强包括旋转、镜像翻转、高斯噪声添加和盐粒噪声注入,但未采用拉伸和颜色变换等操作,以保持金蜗牛卵的形状特征不变。
在模型设计方面,YOLOv8n的结构被优化,以提升其在复杂环境下的检测能力。首先,主干网络中引入了ODConv,通过多维注意力机制提升特征提取能力。这种机制能够动态调整卷积核的权重,以适应不同维度的特征变化,从而提升对遮挡和小目标的识别能力。其次,颈部网络中采用了Slim-neck架构,通过引入GSConv优化特征处理效率,同时保留通道间的依赖关系,从而减少计算复杂度并提升识别精度。最后,检测头部分设计了RFAHead,通过结合空间注意力机制和接收场特征处理,提高了对局部特征的识别能力,特别是对遮挡和小目标的识别。这些改进使得模型在保持较高精度的同时,降低了计算资源的消耗,提升了推理速度。
在实验分析中,改进后的模型在多个指标上表现出色。在训练过程中,使用了PyTorch 1.13.0、Python 3.9.7、CUDA 11.6.2和cuDNN 8.6.0等工具,确保了模型的高效运行。优化过程中采用了SGD作为优化器,初始学习率为0.01,动量因子为0.937,以稳定梯度下降过程。训练使用了16的批量大小,进行了200个训练周期,其中关键超参数包括lr0 = 0.01、lrf = 0.01、mosaic = 1.0、box = 7.5、fliplr = 0.5和flipud = 0.1。通过这些参数的调整,确保了模型在不同场景下的适应性和稳定性。
在模型比较实验中,改进后的YOLOv8n模型在多个主流模型中表现最佳,尤其是在mAP@0.5和mAP@0.5:0.95指标上分别达到了96.5%和68.4%。与Faster R-CNN、YOLOv3-tiny、YOLOv5n、YOLOv6n、YOLOv7-tiny、YOLOv8n、YOLOv9-t、YOLOv10n和YOLOv11n等模型相比,改进后的模型在mAP@.5指标上分别高出18.2%、12.4%、5.2%、10.8%、11.6%、3.3%、5.0%、3.8%和3.4%。在mAP@0.5:0.95指标上则分别高出20.6%、17.5%、8.1%、15.6%、16.1%、4.8%、7.0%、7.7%和6.5%。这些结果不仅证明了改进模型的优越性,还展示了其在复杂田间环境下的适用性。
为了验证模型的泛化能力,本文还使用了南京航空航天大学刘宁中教授公开的数据集进行测试。该数据集通过多角度低空摄影采集,覆盖了多种常见场景,以确保模型的高鲁棒性。经过测试,改进后的模型在多个指标上均优于其他基准模型,表明其在不同环境下的适应性较强。同时,模型的可视化分析也显示了其在识别小尺寸和被遮挡目标时的高效性,这为后续的模型优化和实际应用提供了重要依据。
未来的研究方向将包括扩展实验样本和引入迁移学习,以进一步提升模型的泛化能力。此外,还将采用轻量化优化策略,如模型剪枝和知识蒸馏,以减少模型的计算资源消耗和硬件依赖。通过这些改进,模型将能够在边缘设备或移动终端上实现高效的实时检测,为稻田中金蜗牛卵的及时识别和防控提供技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号