基于视觉基础模型与自监督学习的少样本驱动大规模诱虫标注数据构建方法

【字体: 时间:2025年08月28日 来源:Journal of Integrative Agriculture 4.4

编辑推荐:

  针对传统人工标注依赖专家、效率低下等问题,研究者提出基于Grounding DINO、SAM和SAHI的多尺度昆虫检测框架MLTIDD,结合自监督方法InsectSSRL构建大规模诱虫数据集。该方法在少量样本下实现79.6% AP50-95和90.8% AR,分类准确率达85.87%,较传统方法提升显著,节省80%标注时间,为智能虫害监测提供高效解决方案。

  

在农业病虫害防治领域,智能诱虫灯通过特定光谱诱捕害虫,结合人工智能实现自动识别计数。然而现有模型的性能瓶颈在于缺乏高质量标注数据——传统人工标注需要昆虫学专家参与,面对数万张图像中形态各异的昆虫种类,不仅耗时耗力,还存在小目标漏标、类间差异混淆等问题。浙江理工大学游彦辰团队在《Journal of Integrative Agriculture》发表的研究,创新性地将视觉基础模型与自监督学习结合,建立起一套高效构建大规模诱虫标注数据的标准化流程。

研究团队采用"检测-分类"两阶段框架。首先开发多尺度诱虫检测器MLTIDD,通过改进Grounding DINO的跨尺度特征融合能力,整合分割模型SAM和切片推理工具SAHI,有效解决毫米级小昆虫与大尺寸昆虫的检测差异。随后提出InsectSSRL自监督算法,基于iBOT框架设计三种代理任务,从MLTIDD提取的百万级未标注虫体子图中学习判别性特征。该特征提取器支持分类模型预标注,经专家修正后反向映射至原图,形成完整标注闭环。

关键技术包括:1) 基于SAHI的切片推理处理多尺度昆虫图像;2) 融合视觉Transformer(ViT)和卷积神经网络的混合架构;3) 结合对比学习和掩码图像建模的自监督预训练策略;4) 使用Swin-T分类器进行少样本微调。实验数据来自田间实际部署的智能诱虫灯采集图像。

【主要研究结果】

  1. 1.

    检测性能突破

    MLTIDD在AP50-95和AR指标上分别达到79.6%和90.8%,较基线DINO提升7.0和4.7个百分点。消融实验显示,引入SAHI使小目标召回率提升12.3%。

  2. 2.

    表征学习优势

    InsectSSRL在k-NN评估中取得85.87% top-1准确率,其学习的特征空间呈现明显类别聚集性。可视化显示算法能区分鞘翅目与鳞翅目昆虫的细微纹理差异。

  3. 3.

    少样本分类效能

    仅用5%标注数据微调时,Swin-T+InsectSSRL组合在InsectID数据集上达到80.35%准确率,显著优于ImageNet预训练模型(+11.3%)。特别在夜蛾科等形态相似类群中,错误率降低23.6%。

  4. 4.

    全流程效益

    相比纯人工标注,该方法使专家修正时间缩短80%。标注一致性检验显示,与金标准标注的类间相关系数达0.92。

该研究构建了迄今规模最大的开放获取诱虫图像数据集MLTID-200K,包含203种农业害虫的20万张标注图像。方法学创新体现在:1) 首次将基础模型适配到昆虫多尺度检测场景;2) 开发面向虫体特征的专用自监督算法;3) 建立可推广的少样本标注范式。实际应用中,基于该数据的模型已部署于长三角地区诱虫灯网络,实现稻飞虱等害虫的实时预警,农药使用量减少约15%。未来可扩展至森林害虫监测、病媒生物防控等领域,为智慧农业提供基础数据支撑。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号