
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于残差光谱随机蛙跳-自适应增强集成模型的杨梅可溶性固形物含量无损预测
【字体: 大 中 小 】 时间:2025年06月28日 来源:Food Control 5.6
编辑推荐:
本研究针对杨梅品质无损检测需求,创新性地结合便携式可见-近红外(vis-NIR)光谱仪与自适应增强(AdaBoost)集成学习框架,通过随机蛙跳(RF)算法从残差光谱中迭代筛选变量构建PLS模型,最终集成最优模型使预测均方根误差(RMSEP)降至0.713,较全光谱PLS模型提升7.2%,为高性价比水果品质检测提供了新范式。
杨梅作为中国特色的高价值水果,其可溶性固形物含量(SSC)直接决定风味品质和市场定价。传统折射仪检测需破坏样本,而杨梅无外果皮保护的特性使其在运输中易损,亟需开发快速无损检测技术。虽然近红外光谱(NIRS)已在苹果等水果品质检测中应用,但杨梅等无外皮水果的研究较少,且现有模型存在信号干扰大、单模型鲁棒性差等问题。温州科技职业学院等单位的研究人员通过创新性的"残差光谱挖掘+集成学习"策略,实现了杨梅SSC的高精度预测。
研究采用便携式vis-NIR光谱仪(590-1091 nm)采集500个东魁杨梅样本的交互光谱,经z-score标准化预处理后,运用随机蛙跳(RF)算法进行多轮变量筛选:首轮从全光谱筛选关键变量构建PLS模型后,继续从剩余光谱残差中迭代筛选变量构建新模型。最终选择预测性能最佳的3个PLS模型,通过自适应增强(AdaBoost)算法集成,并与全光谱PLS模型及其他集成策略(均值法、偏差法、Lasso回归)对比。
光谱分析
原始光谱在620 nm处出现C-O/N-H键伸缩振动特征峰,808 nm处吸收最低,970 nm处再现吸收峰。通过连续5轮RF筛选发现,残差光谱仍保留有效信息,第五轮构建的M6模型预测决定系数Rcv达0.699。
模型性能
AdaBoost集成模型表现最优,RMSEP为0.713,较全光谱PLS模型(0.768)提升7.2%,优于偏差法(0.732)、均值法(0.741)和Lasso集成(0.723)。关键波长集中在610-625 nm(糖类特征)、800-810 nm(水分吸收)和960-980 nm(二级倍频区)。
该研究突破性地证实了残差光谱的信息价值,通过"RF迭代筛选+AdaBoost集成"双重优化,不仅为杨梅品质检测提供了经济高效的解决方案(RMSEP<0.72),更为其他易损水果的无损检测提供了技术范式。研究团队特别指出,该方法可适配低成本光谱硬件,对推动农产品在线分拣装备国产化具有重要意义。论文中未引用的参考文献包括Li等(2024)和Yuan等(2020)的研究,相关数据可通过通讯作者申请获取。
生物通微信公众号
知名企业招聘