
-
生物通官微
陪你抓住生命科技
跳动的脉搏
AP162:融合农业知识与视觉特征的大规模害虫识别数据集构建与精准防控应用
【字体: 大 中 小 】 时间:2025年06月09日 来源:Computers and Electronics in Agriculture 7.7
编辑推荐:
【编辑推荐】针对现有农业害虫数据集物种覆盖不足、样本量有限且缺乏专业农学知识整合的问题,四川大学团队构建了包含162类194,700张图像的AP162数据集,创新性地采用农业危害特征与形态学双视角分类策略,通过加权融合领域知识与细粒度视觉特征实现89.2%识别准确率,为智能农业害虫精准防控提供新范式。
在全球农业生产中,害虫每年造成高达38%的作物损失,传统依赖人工的识别方式效率低下且易导致农药滥用(Khan et al., 2023)。现有害虫数据集普遍存在三大瓶颈:样本多样性不足(65%数据集覆盖少于25个物种)、质量参差(如将斜纹夜蛾Spodoptera litura误标为稻螟Sesamia inferens),以及忽视害虫发育阶段差异(如草地贪夜蛾Spodoptera frugiperda幼虫与成虫防控策略迥异)。这些缺陷严重制约了智能识别技术在精准农业中的应用。
四川大学研究团队通过七年系统研究,构建了目前规模最大、标注最严谨的农业害虫数据集AP162。该数据集涵盖162种害虫194,700张图像,创新性地采用"农业危害-视觉形态"双维度分类体系:前者按作物受害类型(如食叶、蛀茎)划分支持靶向防控,后者依据形态相似性(如蝽科昆虫Carpocoris purpureipennis与Dolycoris baccarum的鉴别)优化识别模型。通过七步质控流程(含成虫/幼虫阶段独立标注)和加权融合策略整合领域知识,在MMPretrain框架下实现89.2%的识别准确率,相关成果发表于《Computers and Electronics in Agriculture》。
关键技术包括:1) 多源图像采集(含野外捕捉与实验室标本);2) 双视角标注体系(农业危害类型+视觉形态特征);3) 深度卷积神经网络(如ResNet、Vision Transformer)特征提取;4) 基于PyTorch的加权融合模块(整合农学先验知识与细粒度视觉特征)。
【Pest selection and data annotation procedures】
研究团队依据FAO害虫危害等级筛选物种,采用显微摄影与野外拍摄结合的方式获取图像,通过七步质控流程(含农学专家复核)解决同类数据集常见的误标问题,特别标注了38种害虫的发育阶段差异(如美国白蛾Hyphantria cunea幼虫与成虫)。
【Experiment settings】
实验配置PyTorch框架与MMPretrain工具包,对比测试了ResNet-50和Swin-Transformer等12种模型。结果显示,融合农业知识权重的改进模型在食叶类害虫识别中F1-score提升19.6%,证实领域知识对特定害虫的鉴别具有显著增益。
【Conclusion and future directions】
AP162首次实现了农业专业知识与计算机视觉技术的协同优化,其双视角分类体系为害虫智能监测提供了新思路。未来研究将扩展至害虫-作物互作关系建模,并开发轻量化模型适配田间移动设备。该数据集已开源(https://github.com/SCNYDX-KL/AP162),有望推动农业害虫识别准确率突破90%的技术临界点。
这项研究的核心价值在于:1) 建立首个融合农学语义的大规模基准数据集;2) 揭示发育阶段特征对精准防控的决策价值(如棉铃虫Helicoverpa armigera幼虫期施药效率提升40%);3) 为减少农药滥用(Lee and Yun, 2023)提供可量化的技术路径,对实现联合国SDGs中的可持续农业目标具有实践意义。
生物通微信公众号
知名企业招聘