
-
生物通官微
陪你抓住生命科技
跳动的脉搏
因果启发的学习框架:解决农业害虫识别中的分布外数据偏差问题
【字体: 大 中 小 】 时间:2025年06月29日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对深度学习害虫识别技术因依赖i.i.d.假设而遭遇分布外(OOD)数据性能下降的问题,研究人员提出因果启发学习框架(CL),通过因果特征分离、数据重建及无偏约束模块,实现因果干预与场景多样性增强。实验表明,该方法在Pest-OOD数据集上达到86.68%的准确率,显著提升模型鲁棒性,为智慧农业提供新思路。
农业病虫害每年造成巨大经济损失,传统依赖专家经验的防治方法难以满足大规模生产需求。随着计算机视觉技术的发展,基于深度学习(如CNN、STN、ResNest)的害虫识别方法虽取得进展,但其性能严重受限于训练与测试数据的独立同分布(i.i.d.)假设。现实中,害虫栖息环境复杂多变,导致模型易受背景干扰(如“图1”所示),形成与标签无关的虚假关联,最终在分布外(OOD)数据中表现不佳。
为解决这一挑战,中国某研究团队提出因果启发学习框架(CL),通过因果干预重构数据分布,提取害虫的因果不变特征。该研究不仅建立首个OOD害虫数据集Pest-OOD,更在《Expert Systems with Applications》发表成果,为农业智能化提供新范式。
研究采用结构因果模型(SCM)分析数据偏差机制,设计三大模块:
通过局部特征提取与因果干预,保留与标签相关的核心特征(如害虫纹理),消除背景干扰。实验显示该模块在跨域测试中特征稳定性提升23%。
利用场景提示生成不同光照、背景的合成数据(如“图2”流程),增强训练域多样性。对比实验表明,重建数据使模型在OOD场景下准确率提高12.5%。
OSDM策略量化合成数据的有效性:最大化场景差异(如农田vs温室)同时最小化对象差异(如害虫姿态不变)。消融实验证实该模块防止过拟合,使域泛化F1-score达0.87。
通过重构IP102及网络爬虫收集数据,构建包含多环境域(如昼夜、季节)的基准集。与现有数据集相比,Pest-OOD的OOD挑战性提升34%,成为领域重要补充。
CL框架通过因果干预打破数据偏差,在三个域泛化基准上达到86.68%的SOTA准确率,无需修改网络架构。其意义在于:
未来工作将探索更复杂的因果图模型,并联合多模态数据(如气象信息)进一步提升鲁棒性。
生物通微信公众号
知名企业招聘