基于贝叶斯优化堆叠集成与多模态特征选择的烟草叶片成熟度智能分类方法

【字体: 时间:2025年07月21日 来源:Smart Agricultural Technology 6.3

编辑推荐:

  研究人员针对烟草叶片成熟度人工评估主观性强、现有机器学习方法特征单一且模型融合不足的问题,开展了基于多模态特征选择和贝叶斯优化堆叠集成(BO-stacking)的智能分类研究。通过提取颜色(RGB/HSV)、形状(周长/面积)和纹理(GLCM能量)等42维特征,经方差与Spearman相关性筛选保留15个关键特征,构建了集成RF、LGBM和XGB的优化模型。实验表明该方法在1800张烟草叶片图像测试集上准确率达95.56%,较传统XGBoost提升9.45个百分点,为烟草精准采收提供了自动化解决方案。

  

烟草作为重要的经济作物,其叶片成熟度直接影响后续烘烤质量和产品价值。传统依赖人工观察颜色、纹理的评估方法存在主观性强、稳定性差的问题,而现有计算机视觉方法往往仅关注单一特征或使用独立模型,难以捕捉叶片成熟过程中细微的多模态特征变化。特别是在田间复杂光照条件下,叶片颜色(如从深绿到黄绿的渐变)和纹理(如皱缩程度)的细微差异,使得成熟度分级成为农业图像识别领域的挑战。

中国烟草总公司资助项目的研究团队提出了一种创新解决方案。通过融合多模态特征工程与集成学习技术,研究人员首次将贝叶斯优化(Bayesian optimization)与堆叠集成(stacking)相结合,构建了适用于烟草叶片成熟度分类的智能系统。该系统在测试集上达到95.56%的准确率,较现有最优方法提升6.67个百分点,相关成果发表在农业技术领域期刊《Smart Agricultural Technology》。

研究采用三大关键技术:首先开发双模式图像采集系统(智能手机与树莓派),基于GrabCut算法实现叶片精准分割;其次构建包含颜色矩(R_moment1)、形状参数(周长)和纹理特征(energy_0)的多模态特征集,通过方差过滤(阈值0.05)和Spearman相关性筛选(阈值0.9)降维;最后采用贝叶斯优化调整RF、LGBM和XGB的13项超参数,以加权平均特征重要性构建堆叠模型。

数据收集与特征分析
采集"楚雪26号"五个成熟期(M1-M5)叶片图像1800张,建立包含42维特征的初始数据集。方差过滤后保留的26维特征中,颜色矩R_moment1(第一阶红色通道矩)显示出最高判别力,与叶片叶绿素降解的生理过程高度相关。

特征优化与模型构建
通过三阶段特征选择最终保留15个特征,其中形状特征"周长"和纹理特征"energy_0"被所有基模型列为关键指标。贝叶斯优化显著提升基模型性能,如LGBM的num_leaves参数优化至93,测试准确率提升6.16%。

集成模型性能
BO-stacking模型在测试集上宏平均F1-score达0.9555,其中超熟叶片(M5)识别率达100%。对比实验显示,该模型较非优化版stacking准确率提升4.65%,较单模型最优的BO-LGBM提升8.34%。

与传统方法对比
与Pei等提出的XGBoost方法相比,本研究在相同测试集上准确率提高9.45个百分点,特别是在区分易混淆的M3/M4阶段(94.4% vs 86.7%),证明多特征融合的有效性。

该研究通过多学科方法解决了农业实践中的关键问题。从技术角度看,贝叶斯优化有效平衡了基模型的偏差-方差权衡,而堆叠集成则通过元学习器(逻辑回归)整合了RF对高维数据的鲁棒性、LGBM的高效特征选择能力以及XGBoost的正则化优势。在农业应用层面,95.56%的识别精度可使采收时机误差控制在3天以内,据估算可减少因过早/过晚采收导致的经济损失约12%。研究还发现,第一阶红色通道矩(R_moment1)与叶片类胡萝卜素积累呈强相关性(r=0.82),这为开发低成本田间传感器提供了理论依据。未来工作可探索将该框架扩展至其他作物成熟度评估,并集成近红外光谱等新型传感数据以进一步提升系统鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号