基于生理性状与SSA-XGBoost算法融合的甘蔗叶部病害严重度智能分级研究

《Frontiers in Plant Science》:Intelligent grading of sugarcane leaf disease severity by integrating physiological traits with the SSA-XGBoost algorithm

【字体: 时间:2025年10月15日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  本研究创新性地提出了一种结合生理性状(SPAD值、叶面温度、氮含量)与麻雀搜索算法(SSA)优化XGBoost模型的甘蔗病害严重度智能诊断方法。该方法通过便携式植物养分测定仪(TYS-4N)采集田间数据,利用SSA优化超参数,使模型综合评价指标PRFA达到0.9326,在独立验证集上准确率达0.91。相较于基于图像的深度学习技术,本方案在数据可获取性、计算效率和模型可解释性方面具有显著优势,为农作物病害的快速现场诊断提供了可靠的技术框架。

  
引言
甘蔗作为全球最重要的糖料作物,约占全球糖产量的75%,但其叶部病害的频繁发生严重威胁甘蔗生长发育,导致产量下降、含糖量降低及重大经济损失。准确识别病害严重度对及时采取防控措施、维持作物健康以及实现可持续农业发展至关重要。
近年来,人工智能与传感技术的融合为作物病害智能诊断开辟了新途径。基于图像分析的深度学习模型在多种作物病害识别任务中取得显著成功,但存在环境干扰敏感、设备成本高、难以动态反映植物生理状态变化等局限。本研究提出了一种基于生理性状和智能优化算法的甘蔗叶部病害严重度评估新方法,通过整合SPAD值、叶面温度和氮含量三类生理参数,结合麻雀搜索算法(SSA)优化机器学习模型,实现了病害严重度的快速、准确诊断。
材料与方法
数据采集与预处理
研究数据来源于中国云南省两个代表性甘蔗种植区。主要数据集采集自云南农业大学甘蔗种质资源圃/育种站,涵盖滇蔗和新台糖两个品种。病害严重度根据专家咨询和田间观察系统分为轻度、中度、中重度和重度四个等级。使用便携式植物养分测定仪(TYS-4N)测量感染褐条病、环斑病和花叶病的甘蔗叶片病灶区域的SPAD值、叶面温度和氮含量,每个样本测量三次取平均值。最终获得2212个有效样本,其中轻度343个、中度628个、中重度670个、重度571个。为评估模型泛化能力,在耿马甘蔗种植园收集了635个独立验证样本。
模型选择与超参数优化
研究选取了KNN、AdaBoost、随机森林(RF)、逻辑回归(LR)、决策树(DT)和XGBoost六种代表性机器学习算法。为解决传统超参数调优方法效率低、易陷入局部最优的问题,采用麻雀搜索算法(SSA)进行自动化超参数优化。SSA模拟麻雀种群的觅食和反捕食行为,通过探索者、跟随者和警戒者的角色分工,实现全局探索与局部开发的平衡。优化目标为最大化验证集上的综合评价指标PRFA(精确度、召回率、F1分数和准确率的等权平均值)。
模型评估指标
采用准确率、精确度、召回率、F1分数和PRFA五个指标全面评估模型性能。PRFA作为自定义复合指标,旨在平衡分类性能 across 所有严重度等级,特别是提高对少数类(如轻度病害案例)的检测准确性。
结果
甘蔗叶部病害严重度分布分析
通过小提琴图可视化分析发现,SPAD值和氮含量随病害严重度增加呈现系统性下降趋势,分布形态从对称集中逐渐变为偏斜分散。叶面温度在各严重度等级间分布范围重叠较大,呈现多峰和不对称特征,表明其单独作为诊断特征的判别能力有限。
分类模型的训练与优化
SSA优化显著提升了所有模型的性能。优化后的XGBoost模型表现最佳,精确度、召回率、F1分数和准确率均超过0.9186,PRFA得分达0.9326。特征重要性分析显示,氮含量的贡献度最高,SPAD值次之,叶面温度最低。
外部验证与泛化分析
在耿马独立验证集上,SSA-XGBoost模型整体准确率达到0.91,加权F1分数为0.91,宏观F1分数为0.89。模型对健康(Level 0)和重度感染(Level 3)植株的检测尤为稳健,Level 0召回率达100%,Level 3精确度为98.56%。然而,对中重度(Level 2)病例的分类存在挑战,召回率降至64.57%,F1分数为76.34%,多数被误分类为重度,表明在真实田间条件下,中度严重和重度病害阶段存在症状重叠和过渡特征。
讨论
所选生理性状具有坚实的生物学基础。SPAD值反映叶绿素含量,病害进展导致叶绿体结构破坏而下降;叶面温度受气孔导度和蒸腾速率影响,感染后气孔关闭减少散热而升高;氮含量直接影响植物生长和抗病性。这些指标为分类模型提供了稳定敏感的输入。
SSA优化通过其全局搜索能力和快速收敛特性,有效提升了模型性能,尤其与XGBoost的梯度提升框架协同作用显著,因其能有效优化控制模型复杂度和泛化能力的高维超参数空间。
与深度学习方法相比,本方案在数据获取成本、计算效率和模型可解释性方面具有优势,适合农业现场快速诊断。未来可探索融合图像识别和生理传感的混合诊断系统,实现病害类型和严重度的同步判定。
中重度病害(Class 2)分类性能不佳的挑战源于当前生理特征集在病害发展过渡阶段表征能力不足,以及真实田间环境扰动和植株异质性。未来可通过引入动态生理指标、高阶特征交互、融合无人机遥感表型数据和微气象变量等策略提升模型性能。
结论
本研究成功开发了一种基于生理性状和机器学习(SSA-XGBoost)的甘蔗叶部病害严重度智能分级方法。该方法在测试集和独立验证集上均表现出高精度和强泛化能力,为甘蔗病害的智能管理和预警提供了高效可靠的技术途径,并为其他作物病害的精确识别提供了可复制的方法论支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号