基于遗传算法优化YOLOv9与数据增强的茄子氮钾营养缺失检测研究

【字体: 时间:2025年09月14日 来源:Current Opinion in Virology 5.1

编辑推荐:

  本研究针对传统方法耗时且依赖专家知识的问题,开发了基于遗传算法(GA)优化YOLOv9模型并结合数据增强技术,用于茄子氮(N)和钾(K)营养缺失检测。实验结果显示,该方法准确率达94.52%,mAP50为94.55%,mAP50-95为93.23%,为农民提供了一种高效的田间营养管理工具,推动智慧农业发展。

  

茄子(Solanum melongena L.)作为全球广泛种植的重要经济作物,富含膳食纤维、维生素和矿物质,对维持人体健康具有多重益处。然而,其产量和品质高度依赖氮(N)和钾(K)等宏量营养元素的均衡供应。氮是叶绿素和蛋白质合成的关键成分,钾则参与酶活化、水分调节和果实发育。缺乏这些元素会导致叶片黄化、坏死、果实质量下降,造成严重减产(N缺失可导致减产30–40%,K缺失导致20–35%)。传统营养缺失检测方法依赖人工观察和土壤测试,效率低、耗时长且需要专业知识,难以满足现代精准农业的需求。

尽管深度学习技术在农业领域已应用于病害检测、杂草识别等任务,但此前研究多集中于茄子病害分类或果实识别,尚未见利用遗传算法(GA)优化超参数并结合数据增强技术进行茄子营养缺失检测的报道。因此,开发一种高效、自动化的营养缺失检测方法具有重要的科学价值和实际应用意义。

为应对这一挑战,研究人员开展了一项创新研究,旨在通过结合最新深度学习模型、进化算法和图像增强技术,实现茄子叶片氮、钾缺乏的快速、准确识别。该研究以YOLOv9为核心检测架构,利用遗传算法进行超参数优化,并采用旋转、翻转和噪声注入等数据增强手段提升模型泛化能力。研究成果以论文形式发表在《Current Opinion in Virology》上。

在研究过程中,作者主要采用了以下几项关键技术方法:

首先,从公开数据集OLID I中提取了370张茄子叶片图像,包括健康、氮缺乏、钾缺乏及氮钾同时缺乏四种类别,按60%–20%–20%比例划分训练、验证和测试集。针对类别不平衡问题,采用类别加权策略优化损失函数。

其次,使用YOLOv9模型进行目标检测,该模型在MS COCO数据集上表现出优越的精度-速度权衡,并引入可编程梯度信息(PGI)和广义高效层聚合网络(GELAN)等新机制。

第三,应用数据增强技术,通过水平翻转、随机旋转(-10°至+10°)和噪声注入(0.05%像素)扩充训练集至592张图像,提升模型鲁棒性。

第四,利用遗传算法进行超参数调优,迭代200次,使用加权目标函数(f = 0.1 × mAP50 + 0.9 × mAP50-95)评估模型表现,确定最优超参数组合。

最后,使用NVIDIA Quadro M4000 GPU进行模型训练,并通过准确率、精确度、召回率、F1分数及多种平均精度均值(mAP)指标综合评价模型性能。

2.1. 数据集与预处理

研究人员从OLID I数据集中筛选出370张图像,包含91张健康叶片、67张氮缺乏、106张钾缺乏和106张氮钾同时缺乏的样本。使用Roboflow进行标注,并按比例划分数据集。为解决类别不平衡,应用类别权重调整损失函数。图像尺寸从3024×3024统一调整至640×640以适应YOLO输入要求。通过热力图和标注示例可视化边界框分布及标签信息,确保数据质量。

2.2. 实验设置

实验在Jupiter Notebook环境中进行,使用NVIDIA Quadro M4000 GPU(8GB显存)。采用YOLOv9-t模型,配备AdamW优化器(动量0.9,学习率0.000833),设置早停策略(耐心值30轮)防止过拟合。模型包含225层、2,006,188参数,计算需求为7.9 GFLOPs,并加载319个预训练权重进行初始化。

2.3. YOLOv9

YOLOv9凭借其新颖的可逆函数、信息瓶颈原理和PGI机制,在目标检测任务中实现了速度与精度的最佳平衡。相比ResNet、EfficientNet等模型,YOLOv9更适用于实时应用和边缘设备部署。研究通过对比MS COCO数据集上的性能,证实YOLOv9在mAP与延迟关系上优于YOLOv8、YOLOv7等前代模型。

2.4. 数据增强

为解决数据量不足和类别不平衡,研究设计了包含水平翻转、随机旋转和噪声注入的数据增强流程。这些操作模拟了田间拍摄时可能遇到的视角、光线及设备质量变化,增强了模型泛化能力。增强后训练集增至444张图像,总样本数达592张。

2.5. 遗传算法

遗传算法通过模拟自然选择过程优化超参数,仅采用突变机制(未使用交叉)以降低计算复杂度。对比贝叶斯优化、网格搜索和随机搜索,GA在并行处理和避免局部最优方面表现更佳。算法迭代200次,评估不同超参数组合对模型性能的影响。

3.1. 基于遗传算法的超参数调优

超参数调优显著提升模型性能,最佳超参数组合使适应度分数从0.543提升至0.579(增长6.63%),mAP50从56.03%提高到59.93%,mAP50-95从54.17%增至57.68%。通过平行坐标图和散点图聚类分析,发现较高动量(0.9–1.0)、中等权重衰减和较低学习率有助于获得更优结果。

3.2. 结果与讨论

最终模型结合GA调优和数据增强,在测试集上达到94.52%准确率、94.55% mAP50、93.23% mAP50-95,精确度、召回率和F1分数分别为95.9%、92.8%和94.32%。损失函数中box loss、class loss和dfl loss分别降至0.40、0.29和0.80。混淆矩阵显示模型主要混淆发生在单元素缺乏(N、K)与混合缺乏(N_K)之间,源于症状相似性和环境干扰。

精度-置信度、召回-置信度及F1-置信度曲线表明模型在各置信阈值下均保持稳定性能。与既往研究对比,本方法在mAP和准确率上均优于已有茄子病害检测模型(如YOLOv7-OBB的88.84% mAP、CenterNet的88%准确率),凸显了GA与数据增强的有效性。

该研究成功开发了一种基于YOLOv9架构、经遗传算法优化并融合数据增强的深度学习模型,用于茄子氮、钾营养缺失的高精度检测。该方法不仅显著提升了检测准确率和鲁棒性,而且为解决农业中小样本、不平衡数据及复杂环境下的视觉识别问题提供了有效范例。

研究结论表明,结合进化算法与数据增强的策略可大幅改善模型性能,其中数据增强对性能提升贡献更大,而GA优化进一步巩固了模型表现。该技术方案具备迁移到其他作物营养缺失检测的潜力,为开发实时田间诊断工具奠定了坚实基础。

未来工作可扩展至其他宏量元素(如钙、镁、硫、磷)和微量元素(硼、铁、锰、铜等)的缺失检测,采集更多样化田间图像,并探索生成对抗网络(GANs)合成数据、移动端部署等方向,推动精准农业和可持续农艺管理的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号