因果启发的学习框架:解决农业害虫识别中的分布外数据偏差问题

【字体: 时间:2025年06月29日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对深度学习害虫识别技术因依赖i.i.d.假设而遭遇分布外(OOD)数据性能下降的问题,研究人员提出因果启发学习框架(CL),通过因果特征分离、数据重建及无偏约束模块,实现因果干预与场景多样性增强。实验表明,该方法在Pest-OOD数据集上达到86.68%的准确率,显著提升模型鲁棒性,为智慧农业提供新思路。

  

研究背景与意义

农业病虫害每年造成巨大经济损失,传统依赖专家经验的防治方法难以满足大规模生产需求。随着计算机视觉技术的发展,基于深度学习(如CNN、STN、ResNest)的害虫识别方法虽取得进展,但其性能严重受限于训练与测试数据的独立同分布(i.i.d.)假设。现实中,害虫栖息环境复杂多变,导致模型易受背景干扰(如“图1”所示),形成与标签无关的虚假关联,最终在分布外(OOD)数据中表现不佳。

为解决这一挑战,中国某研究团队提出因果启发学习框架(CL),通过因果干预重构数据分布,提取害虫的因果不变特征。该研究不仅建立首个OOD害虫数据集Pest-OOD,更在《Expert Systems with Applications》发表成果,为农业智能化提供新范式。

关键技术方法

研究采用结构因果模型(SCM)分析数据偏差机制,设计三大模块:

  1. 因果特征分离模块:提取低维因果特征(如局部害虫形态);
  2. 因果数据重建模块:结合场景提示(scene prompt)生成多样背景的合成数据;
  3. 无偏数据约束模块:通过对象-场景距离度量(OSDM)平衡对象一致性与场景多样性。实验基于IP102数据集重建的Pest-OOD(含13类害虫),验证域泛化性能。

研究结果

因果特征分离模块

通过局部特征提取与因果干预,保留与标签相关的核心特征(如害虫纹理),消除背景干扰。实验显示该模块在跨域测试中特征稳定性提升23%。

因果数据重建模块

利用场景提示生成不同光照、背景的合成数据(如“图2”流程),增强训练域多样性。对比实验表明,重建数据使模型在OOD场景下准确率提高12.5%。

无偏数据约束模块

OSDM策略量化合成数据的有效性:最大化场景差异(如农田vs温室)同时最小化对象差异(如害虫姿态不变)。消融实验证实该模块防止过拟合,使域泛化F1-score达0.87。

Pest-OOD数据集

通过重构IP102及网络爬虫收集数据,构建包含多环境域(如昼夜、季节)的基准集。与现有数据集相比,Pest-OOD的OOD挑战性提升34%,成为领域重要补充。

结论与讨论

CL框架通过因果干预打破数据偏差,在三个域泛化基准上达到86.68%的SOTA准确率,无需修改网络架构。其意义在于:

  1. 方法论创新:首次将因果推理引入害虫识别,为OOD问题提供可解释解决方案;
  2. 应用价值:Pest-OOD数据集推动农业视觉研究的标准化;
  3. 扩展性:框架可迁移至其他领域(如医学影像),解决数据分布偏移问题。

未来工作将探索更复杂的因果图模型,并联合多模态数据(如气象信息)进一步提升鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号