
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于VGG16架构的高效深度学习模型在土豆害虫自动检测中的应用研究
【字体: 大 中 小 】 时间:2025年09月13日 来源:Smart Agricultural Technology 5.7
编辑推荐:
本研究针对土豆作物害虫检测效率低、准确性不足的问题,开发了一种基于VGG16架构的深度学习模型。通过迁移学习和数据增强技术优化模型性能,实验结果显示该模型在准确率(96.3%)、精确度(95.8%)、召回率(96.1%)和F1分数(95.9%)上均优于ResNet50、InceptionV3等基线模型,平均单图推理时间仅45毫秒,具备良好的边缘设备部署潜力,为智慧农业中的实时害虫监测提供了可靠解决方案。
土豆(Solanum tuberosum)作为全球第三大主食作物,在保障粮食安全特别是发展中国家生计方面具有战略意义。然而,土豆极易受到蚜虫(如Myzus persicae)、科罗拉多土豆甲虫(Leptinotarsa decemlineata)和潜叶蝇(Liriomyza spp.)等害虫的侵袭,导致严重减产和质量下降。传统害虫检测主要依赖人工田间巡查,这种方法不仅耗时费力、主观性强,且难以大规模应用。近年来,虽然深度学习技术在植物病害识别中取得显著进展,但大多数研究集中于病害而非害虫识别,且多使用背景单一、光照可控的实验环境图像,难以应对真实农田中的复杂场景。
针对这一研究空白,来自国际商业农业与技术大学农业科学学院的Nibedita Deb和Tawfikur Rahman在《Smart Agricultural Technology》发表论文,开发了一种基于VGG16架构的高效深度学习模型,用于土豆害虫的自动检测与分类。该研究不仅构建了一个包含3000张标注图像的真实田间害虫数据集,还通过迁移学习和数据增强策略显著提升了模型在复杂环境下的泛化能力。
研究团队主要采用了以下关键技术方法:首先,从孟加拉国农村农田直接采集了涵盖健康叶片及蚜虫、甲虫、潜叶蝇、瓢虫等四类害虫感染叶片的图像数据,并进行了标准化裁剪和尺寸归一化(224×224像素)。其次,应用了旋转、翻转、缩放和对比度调整等数据增强技术以提升模型鲁棒性。最后,基于预训练的VGG16网络进行迁移学习,通过冻结卷积层参数并自定义分类头结构,结合全局平均池化和Dropout层防止过拟合,使用随机梯度下降(SGD)和交叉熵损失函数进行模型优化。
模型性能表现
实验结果显示,该VGG16模型在多项指标上均优于对比模型:准确率达96.3%,精确度95.8%,召回率96.1%,F1分数95.9%。特别是在科罗拉多土豆甲虫的检测中表现最佳(F1-score 96.9%),而对形态相似的蚜虫和潜叶蝇则存在少量误判。ROC曲线分析表明,所有类别的AUC值均介于0.96–0.99之间,证实了模型出色的分类判别能力。
数据增强与泛化分析
通过消融实验发现,移除旋转或对比度增强会导致准确率下降约3–4%,凸显了数据增强对模型性能的关键作用。在未见过的田间数据测试中,模型仍保持93.7%的准确率,但在光照不足或遮挡严重的场景下性能略有下降。
计算效率与部署可行性
在NVIDIA RTX 3060环境下,模型单图推理时间仅为45毫秒,模型大小528 MB。尽管参数量较大(138.4M),但其推理速度优于ResNet50和EfficientNetB0。在树莓派4B上的测试进一步验证了其在边缘设备上的部署潜力,能耗较GPU降低83.9%。
分类器多样性融合
研究还尝试了多模型集成策略(VGG16、ResNet50、MobileNetV2),集成后的模型在各项指标上较单一模型提升约2.3%,尤其在难以区分的害虫类别上表现出更强的鲁棒性。
研究表明,基于VGG16的迁移学习框架在土豆害虫检测任务中兼具高性能与实用性。该模型不仅能有效应对真实农田中的复杂场景,还通过优化推理效率实现了边缘设备部署的可能。未来工作将集中于扩展害虫种类覆盖、融合多模态传感器数据,以及开发轻量级模型以进一步提升实时监测能力。该研究为智慧农业中的害虫精准治理提供了技术支撑,对减少农药滥用、提高作物产量具有重要意义。
生物通微信公众号
知名企业招聘