《Frontiers in Plant Science》:ORBMO-RF: a non-destructive classification method for ginseng seeds based on multimodal fusion and improved red-billed blue magpie optimization algorithm
编辑推荐:
本文提出一种结合图像形态特征与高光谱数据的人参种子智能分类方法,通过改进红嘴蓝鹊优化算法(ORBMO)优化随机森林(RF)模型参数,实现四种人参种子(栽培参/山地参/韩国参/西洋参)的无损精准鉴别。研究采用递归特征消除(RFE)和竞争性自适应重加权采样(CARS)分别筛选形态与光谱特征,融合后输入优化模型,准确率达97.50%。该方法为中药材种子质量控制提供了新技术支撑(Frontiers in Plant Science, 2025)。
1 引言
人参作为珍贵药用植物,其种子精准分类直接影响生产流程与药材质量稳定性。现有研究表明,人参种子系统化自动精准分类技术尚不成熟,存在技术瓶颈。传统形态学鉴定依赖人工目视,存在效率低、一致性差等问题;化学鉴定方法如DNA检测虽精度高但成本高昂。本研究创新性提出基于多模态数据融合的智能分类方法,为产业规模化分选提供理论技术基础。
2 材料与方法
2.1 实验流程
实验在Windows 10系统下运行,使用Python 3.12环境,硬件配置为Intel?Core? i7-13700KF处理器与NVIDIA GeForce RTX 4070 Ti SUPER显卡。工作流程包括图像与高光谱数据采集、预处理、特征选择、多模态特征融合及优化模型构建。
2.2 数据采集
研究对象为四类人参种子:栽培人参种子(CGS)、山地栽培人参种子(MCGS)、韩国人参种子(KGS)及西洋参种子(AGS)。每品种选取2000粒完整饱满种子,经吉林农业大学专家鉴定确认。
图像数据采用iPhone 14 Pro Max主摄拍摄,分辨率3024×4032像素,在标准摄影棚内固定光源下采集。高光谱数据使用FieldSpec 4光谱仪(350~2500 nm范围)获取,每组采集130条光谱曲线。
2.3 数据预处理
图像数据经灰度转换、高斯滤波降噪、Otsu二值化后,提取34维形态特征(18个几何特征如周长、面积、长宽比等,16个纹理特征如对比度、能量、LBP等)。高光谱数据保留400~2400 nm有效波段,采用SG平滑滤波(SG smoothing)、多元散射校正(MSC)及其组合方法去噪。
2.4 特征选择
形态特征通过递归特征消除(RFE)和基于模型的选择(SFM)筛选出10个关键特征(如hist4、hist8、Ed、L等),维度降低68.75%。高光谱特征采用连续投影算法(SPA)和竞争性自适应重加权采样(CARS)分别提取8个和13个特征波段,降维率达99%以上。SPA所选波段(如420 nm、476 nm、829 nm)与种子色素、水分、蛋白质等化学成分吸收峰相关;CARS波段(如413 nm、924 nm、1671 nm)覆盖可见-近红外区,反映色素与官能团(C–H、O–H)信息。
2.5 分类模型构建
2.5.1 随机森林模型优化
针对RF模型超参数调优难题,引入改进红嘴蓝鹊优化算法(ORBMO),通过三种机制增强搜索能力:
(1)改进Circle混沌映射初始化种群,提升全局探索性;
(2)黄金正弦搜索策略(GSS)结合Lévy飞行扰动,平衡局部开发与全局跳跃;
(3)自适应模拟退火(ASA)机制,依概率接受劣解避免局部最优。
ORBMO-RF模型参数寻优范围:n_estimators∈[10,300],max_features∈[3,20]。
2.5.2 多模态特征融合分类
将形态与光谱特征融合后输入ORBMO-RF模型,比较单一特征与融合特征性能。评价指标包括准确率(Acc)、精确率(P)、召回率(R)和F1值(F1-score)。
3 结果与分析
3.1 特征选择效果
形态特征中,AGS在hist4、hist8等纹理特征上显著区分;MCGS几何特征最小,AGS最大。高光谱特征经CARS筛选后,t-SNE可视化显示类内紧密度与类间分离度优于SPA。SHAP分析证实CARS所选波段(如1097 nm、1349 nm)对分类贡献度最高。
3.2 分类性能比较
单一特征模型中,高光谱数据分类准确率(89.67%)显著高于形态特征(52.50%)。多模态特征融合后,RFE-CARS组合的RF模型测试集准确率提升至92.81%。ORBMO-RF模型进一步优化,准确率达97.50%,精确率、召回率、F1值均超97.5%。对比其他优化算法(PSO、MPA),ORBMO收敛曲线更稳定,跳出局部最优能力更强。
3.3 深度模型对比
在相同特征集下,ORBMO-RF表现优于1D-CNN、ResNet1D和Transformer等深度学习模型(准确率最高94.3%),凸显小样本数据中优化传统模型的优势。
3.4 混淆矩阵分析
ORBMO-RF对四类种子识别率均超95%,其中KGS达100%,MCGS和AGS的F1值从85.16%、87.12%提升至95.12%、95.48%,显著改善易混淆品种的区分能力。
4 讨论
本研究首次将改进ORBMO算法应用于人参种子多模态分类,解决形态相似品种鉴别难题。方法创新点包括:
(1)多模态特征化学解释性明确,SPA与CARS所选波段对应色素、多糖等生物标志物;
(2)ORBMO算法融合混沌映射、黄金正弦与自适应退火,提升参数优化效率;
(3)为中药材种子无损检测提供可迁移范式。
局限在于未考虑贮藏变质等实际因素,后续将引入环境参数增强模型鲁棒性。