利用模型可解释性和细粒度混合数据增强技术,实现对无人机图像中杏树病害的鲁棒检测
《Expert Systems with Applications》:Leveraging model explainability and fine-grained cutmix augmentation for robust detection of apricot diseases in UAV images
【字体:
大
中
小
】
时间:2025年07月17日
来源:Expert Systems with Applications 7.5
编辑推荐:
Apricot病害检测中采用无人机图像分析,通过DCGAN生成背景与前景并利用SHAP模型解释性分析弱点,结合MGC数据增强策略提升模型在多样化环境下的检测性能。
在当前全球农业领域,杏(Prunus Armeniaca)作为一种重要的仁果类水果,广泛种植于温带地区,具有显著的经济价值。每年杏类水果的出口额高达5亿美元,但其产量和品质却受到多种病害和虫害的严重威胁。其中,褐腐病和穿孔病是影响杏类水果产量的两大主要病害,其对果实质量、产量以及果树健康状况的破坏性不容忽视。在美国,褐腐病每年预计造成杏类产业约1000万美元的损失,而根据联合国粮食及农业组织(FAO)的数据,2020年全球因杏类病害造成的产量损失约为120万吨,其中土耳其、伊朗、乌兹别克斯坦、阿尔及利亚和意大利的损失尤为突出,分别为32万吨、25万吨、15万吨、10万吨和8万吨。因此,如何高效地检测杏类病害,减少其对产量和品质的影响,成为农业技术研究的重要方向。
随着科技的发展,无人机和计算机视觉技术为杏类病害的检测提供了新的可能性。这些技术能够快速、高效地对果园进行扫描,识别病害的早期迹象,从而为农民提供及时的应对措施。例如,通过无人机搭载高分辨率摄像头,可以获取大量高质量的果园图像,为病害检测模型提供丰富的训练数据。然而,尽管这些技术具有巨大的潜力,它们的实际应用仍然面临诸多挑战。其中,一个关键的问题是训练数据的不足。当前的杏类病害检测数据集往往缺乏多样性和全面性,特别是在不同环境条件、病害发展阶段和病害表现形式方面存在明显局限。这些数据集通常由人工标注而成,且多数情况下仅包含在控制环境下拍摄的图像,无法反映实际农业生产中复杂的环境因素,如光照变化、遮挡和背景多样性。
此外,现有的数据增强方法,如随机裁剪、翻转和旋转,虽然能够扩展数据集并提高样本的多样性,但它们在生成样本时缺乏对细节的精准控制,特别是在目标检测任务中。这种不足限制了模型在真实环境中的泛化能力,使其在面对多样化的病害表现时表现不佳。为了解决这一问题,本文提出了一种创新的数据增强方法,结合深度卷积生成对抗网络(DCGAN)和基于模型解释的Cutmix(MGC)技术,通过生成符合实际病害特征的合成图像,提高检测模型的性能。
本文的研究方法基于对模型失败案例的分析。通过对目标检测模型的错误识别进行研究,可以发现模型在哪些方面存在不足,从而有针对性地生成新的样本。具体而言,本文利用SHapley Additive exPlanations(SHAP)技术对模型进行解释,分析其在病害检测中的薄弱环节,并基于这些分析生成符合实际病害特征的合成图像。这些合成图像不仅能够丰富数据集,还能提升模型在不同环境条件下的适应能力。例如,通过调整合成图像的标签分布、长宽比、尺度以及亮度和对比度,可以更精确地模拟真实病害的表现形式,从而提高模型的检测精度。
为了进一步提高数据集的多样性,本文还采用了两种不同的生成对抗网络进行图像生成。一种是用于生成背景图像的DCGAN,另一种是用于生成果实图像的条件DCGAN(cDCGAN)。通过将不同类别的杏类果实图像叠加在真实或合成的背景图像上,可以更精准地模拟病害的实际情况。这种基于条件的图像生成方法能够实现对合成图像的精细控制,使模型在训练过程中能够接触到更多样化的数据,从而提高其泛化能力和检测性能。
本文的研究成果表明,通过引入基于模型解释的Cutmix技术,可以有效提升杏类病害检测模型的性能。实验结果显示,在较小的数据集基础上,该方法能够实现4%的平均精度(mAP)提升。此外,当使用该方法训练的Apricot-10K增强数据集进行模型训练时,该方法在多个先进的目标检测模型中实现了1-4%的mAP提升。这说明,本文提出的方法不仅能够解决数据集不平衡的问题,还能通过动态的数据增强提升模型的鲁棒性。
本文的研究方法还具有重要的实际应用价值。通过无人机采集的杏类果实和叶片图像,结合计算机视觉算法,可以实现对病害的快速检测。这种技术不仅能够帮助农民及时发现病害,还能减少农药的使用量,降低对环境的影响。此外,该方法还能够提高病害检测的准确性,使农民能够采取更加精准的防治措施,从而提高产量和品质。
本文的研究成果为杏类病害检测提供了一种新的解决方案,其核心在于利用生成对抗网络和模型解释技术相结合的方式,实现对病害图像的合成和增强。这种合成方法不仅能够解决数据集不足的问题,还能通过动态的数据增强提升模型的泛化能力。此外,该方法还能够提高病害检测的精度,使农民能够更加有效地管理果园,减少病害对产量和品质的影响。
在数据集的构建方面,本文收集了来自巴基斯坦开伯尔-普赫图赫瓦省的杏类果实和叶片图像,使用DJI Mavic Mini无人机搭载12 MP摄像头进行拍摄。这些图像具有较高的分辨率,能够清晰地展示杏类果实和叶片的细节。通过手动控制无人机的飞行速度和方向,以及调整摄像头的拍摄角度,可以确保图像的多样性和代表性。这些图像的采集方式为病害检测模型提供了丰富的训练数据,有助于提高模型的检测精度。
在实验设置方面,本文的实验环境采用了高性能的计算设备,包括Intel Core i7 10700 CPU、16 GB RAM和RTX 3060 GPU,运行Windows 10 Pro操作系统。整个数据处理系统基于Python语言,使用PyTorch深度学习框架和OpenCV图像处理库进行开发。通过这种方式,可以确保实验的高效性和准确性。
在实验结果方面,本文对提出的合成方法进行了全面的评估,结果表明该方法在杏类病害检测任务中具有显著的优势。通过对不同环境条件下的杏类果实和叶片图像进行测试,可以验证该方法在真实环境中的适用性。实验结果还显示,该方法能够有效提升检测模型的性能,使其在面对复杂和多变的病害表现时表现更加稳定。
本文的研究成果不仅为杏类病害检测提供了新的解决方案,还为其他作物的病害检测研究提供了参考。通过结合生成对抗网络和模型解释技术,可以实现对病害图像的精准合成和增强,从而提高检测模型的性能。此外,该方法还能够减少对人工标注数据的依赖,降低数据收集和标注的成本。
综上所述,本文提出了一种创新的杏类病害检测方法,其核心在于利用生成对抗网络和模型解释技术相结合的方式,实现对病害图像的合成和增强。该方法不仅能够解决数据集不足的问题,还能通过动态的数据增强提升模型的泛化能力和检测精度。通过无人机采集的杏类果实和叶片图像,结合计算机视觉算法,可以实现对病害的快速检测,为农民提供及时的应对措施,减少病害对产量和品质的影响。本文的研究成果为杏类病害检测提供了新的思路,也为其他作物的病害检测研究提供了有价值的参考。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号