
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于随机森林的新鲜切割火箭叶氨与叶绿素无损可解释估测方法研究
【字体: 大 中 小 】 时间:2025年05月27日 来源:Information Processing in Agriculture 7.7
编辑推荐:
为解决新鲜蔬菜质量评估中传统方法效率低、主观性强的问题,意大利研究人员开发了一种基于随机森林(RF)的机器学习方法,通过图像分析非破坏性估测火箭叶中氨(NH3)和叶绿素含量。研究提出平衡采样策略BAL-RF,显著提升预测精度(RSE改善6.6%-10.4%),并结合特征重要性分析增强模型可解释性,为食品供应链智能监测提供新方案。
新鲜蔬菜的品质直接影响消费者选择,但传统评估方法面临效率低、主观性强等挑战。人工视觉检查易受操作者差异影响,而理化检测通常具有破坏性且成本高昂。近年来,基于计算机视觉系统(CVS)的非接触式评估方法崭露头角,但现有技术对氨和叶绿素等关键指标的预测仍存在数据分布不均、模型可解释性不足等问题。
意大利的研究团队针对火箭叶(Eruca sativa Mill.)这一高经济价值蔬菜,开发了创新的机器学习解决方案。叶绿素降解和氨积累是反映蔬菜新鲜度的核心指标——叶绿素减少30%通常标志保质期终点,而氨作为蛋白质分解产物,其浓度与腐败程度正相关。此前Palumbo等虽尝试用随机森林预测这些指标,但标准采样方法导致边界值预测不准,且缺乏解释机制。
研究采用3CCD相机采集1191张火箭叶图像,通过CIE Lab色彩空间转换和Otsu算法分割前景,提取ab*平面68121维颜色直方图特征。核心创新在于提出BAL-RF采样策略:将目标变量离散化为m个区间后,每棵回归树从各区间均匀采样n/m个实例(保留或剔除重复样本),有效解决数据分布偏斜问题。通过Gini指数量化特征重要性,实现预测结果的可解释性分析。
【图像采集与预处理】
建立标准化成像系统,使用X-Rite色卡校正颜色,在10°C模拟市场存储条件下捕获不同新鲜度阶段的叶片图像。通过HSV空间的Hue分量阈值分割叶片区域,最终保留1997个非零颜色特征。
【改进的随机森林算法】
BAL-RF通过目标变量离散化(m=2/4/8)引导采样:当以叶绿素为离散化基准(disc_on=Chlorophyll)时,氨预测RSE改善6.6%;而以氨为基准时叶绿素预测RSE提升10.4%。实验表明m=2-4时效果最佳,过度分箱会扭曲数据分布。
【模型性能比较】
在10折交叉验证中,BAL-RF(no rep)显著优于7种对照方法:对氨的预测RMSE最低达0.25(对比Palumbo方法的0.28),叶绿素预测RMSE达0.15。传统线性回归(LR)表现最差(RSE>1),而深度学习方法(ResNet50、ViT)因过度关注形状特征而非颜色分布,效果不及基于直方图的模型。
【关键特征解析】
重要性分析揭示:氨预测主要关联a=-25(红绿色调)和b=15(蓝黄色调)区间特征;叶绿素预测则依赖a=-20至-15、b=5-10的绿色系特征,与植物生理学认知高度一致。
该研究通过创新采样策略解决了非均匀分布数据的建模难题,首次实现氨含量的可解释图像估测。方法可直接部署于现有供应链监控系统,相比高光谱成像(HSI)更经济高效。未来可扩展至其他叶菜类作物,并结合时序分析开发动态新鲜度预测模型。论文发表于《Information Processing in Agriculture》,为智慧农业中的质量检测提供了兼具精度与透明度的新范式。
生物通微信公众号
知名企业招聘