基于深度学习与IP102数据集重构的昆虫生活史阶段智能分类系统开发及其在农业害虫治理中的应用

【字体: 时间:2025年06月03日 来源:Ecological Informatics 5.9

编辑推荐:

  为解决农业害虫管理中早期生活史阶段识别依赖专家评估、成本高且效率低的问题,研究人员利用深度学习技术对IP102数据集进行重构,新增卵、幼虫、蛹和成虫四阶段标注,采用ResNet50和EfficientNetV2M模型实现昆虫物种与生活史阶段的双重分类。结果表明EfficientNetV2M模型综合性能更优(F1-score达72.0%),为农业监测提供高效自动化解决方案。

  

在农业生产和生态保护领域,昆虫既是维持生物多样性的关键环节(如传粉和生物防治),又是威胁作物产量的主要害虫。传统昆虫识别高度依赖专家形态学鉴定,但幼虫和蛹阶段常缺乏鉴别特征,分子鉴定又存在成本高、耗时长等问题。尤其令人头疼的是,害虫防治的关键窗口期往往出现在幼虫阶段,而现有技术难以实现田间快速识别。这种矛盾催生了计算机视觉技术的应用需求,但现有昆虫图像数据集普遍存在生命阶段标注缺失、类间相似度高、样本分布不均衡等挑战。

针对这一系列问题,研究人员开展了一项创新性研究,通过重构大规模昆虫图像数据集IP102,开发了基于深度学习的双重分类系统。该研究首先对原始IP102数据集进行系统性优化:剔除无昆虫主体的损伤图像、排除多生命阶段混杂的样本,并为75,222张图像新增卵、幼虫、蛹、成虫四阶段精细标注,最终构建包含64,799张标准化图像的训练集。在方法学层面,研究团队采用迁移学习策略,对比测试了ResNet50和EfficientNetV2M两种卷积神经网络架构。其中ResNet50通过添加全局平均池化层(GAP)和自定义全连接层进行改造,而EfficientNetV2M则利用其特有的MBConv模块实现更高效的特征提取。所有模型均在NVIDIA RTX4090 GPU平台上训练,采用Adam优化器(学习率0.0001)和交叉熵损失函数,并引入旋转、翻转等数据增强技术提升泛化能力。

研究结果展现出显著的技术突破。在生命阶段分类任务中,EfficientNetV2M以96.8%的准确率显著优于ResNet50(96.1%),尤其对形态多变的幼虫识别准确率达94%。值得注意的是,数据增强对蛹阶段识别提升明显,使ResNet50的准确率从61%提升至62%。而在更具挑战性的物种分类任务中,模型对成虫的识别准确率(74.8%)显著高于其他阶段,印证了成虫形态特征更稳定的生物学规律。通过将物种与生命阶段预测结果融合,系统最终实现72.1%的综合准确率,较基线模型提升近23个百分点。

讨论部分揭示了若干关键发现。首先,EfficientNetV2M的优异表现归功于其复合缩放机制(compound scaling),能自动平衡网络深度、宽度和分辨率。其次,研究证实数据增强对提升小样本类别(如卵阶段)识别效果有限,暗示需要针对性设计增强策略。最重要的是,该研究首次实现了IP102数据集在生命阶段分析维度的价值挖掘,为开发田间实时监测设备奠定算法基础。

这项发表于《Ecological Informatics》的研究具有多重应用价值:在实践层面,幼虫阶段的精准识别可指导农药精准施用,减少90%以上的非目标杀伤;在科研层面,构建的标注数据集为昆虫发育生物学研究提供新工具。未来研究可探索轻量化模型部署、多模态数据融合等方向,进一步推动AI技术在智慧农业中的深度应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号