
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多模态数据融合与在线更新策略的玉米籽粒跨年度稳定分类研究
【字体: 大 中 小 】 时间:2025年06月30日 来源:Microchemical Journal 4.9
编辑推荐:
为解决玉米籽粒因收获年份差异导致传统分类方法性能不稳定的问题,研究人员整合图像特征、高光谱数据(hyperspectral)和低场核磁共振信号(LF-NMR),构建多模态分类框架,结合增量支持向量数据描述(ISVDD)和最小二乘支持向量机(LSSVM)实现模型在线更新。结果显示,多模态融合准确率达98.63%,SHAP可解释性分析揭示了584?nm、777?nm光谱波段及核磁信号强度等关键特征贡献,为农业智能检测提供了新方法。
玉米作为全球主要粮食作物,其种子质量直接影响农业生产效益。然而,同一品种玉米籽粒在不同年份收获后,因环境、储存条件差异导致理化特性显著变化,传统鉴定方法如形态学观察、蛋白质电泳和DNA标记技术面临巨大挑战:形态特征易受环境影响,蛋白质电泳受限于成分特异性,而DNA标记难以捕捉遗传相似品种的细微差异。更关键的是,这些方法假设种子特性稳定,无法应对跨年度数据分布漂移问题。
针对这一难题,吉林农业大学智能农业研究院的研究团队创新性地提出多模态数据融合策略,结合在线模型更新技术,实现了玉米籽粒跨年度稳定分类,成果发表于《Microchemical Journal》。研究通过整合图像特征(表征颜色、纹理)、高光谱数据(400-2500?nm光谱反射率)和低场核磁共振信号(LF-NMR,检测种子内部水分分布),构建了动态分类框架。关键技术包括:基于ReliefF算法筛选5个图像特征,BOSS算法提取37个高光谱特征波段,以及LF-NMR信号峰值强度分析;采用增量支持向量数据描述(ISVDD)和最小二乘支持向量机(LSSVM)实现模型在线更新;利用SHAP(SHapley Additive exPlanations)方法解析模型决策机制。
Results of image feature extraction
通过交叉验证对比发现,ReliefF算法筛选的5个图像特征(饱和度标准差s_dev、纹理对比度contrast、色调均值h_mean等)使分类准确率提升至72.50%,优于全特征集的68.20%,证实了特征选择对提升模型效率的关键作用。
Results of hyperspectral feature extraction
BOSS算法从高光谱数据中提取的37个特征波段(含584?nm、777?nm等关键波段)将分类准确率提高至82.50%,SHAP分析显示这些波段与玉米籽粒淀粉、蛋白质含量密切相关。
Results of LF-NMR feature extraction
LF-NMR信号的最大强度(Smax)和弛豫时间T2分布特征贡献显著,单模态分类准确率达82.10%,反映种子内部水分状态与品种特性的强关联性。
Results of multimodal fusion and model updating
多模态融合使初始分类准确率跃升至90.07%,而在线更新策略(ISVDD+LSSVM)进一步将准确率提升至98.63%,显著优于单模态方法。SHAP全局分析揭示,LF-NMR信号强度(贡献度28.7%)、584?nm(12.3%)和777?nm(11.9%)光谱波段及图像纹理特征是跨年度分类的核心指标。
Discussion
研究突破传统静态模型的局限,首次将增量学习引入农业种子分类领域。多模态数据互补性有效克服了单模态表征不足的缺陷——图像特征捕获表型变异,高光谱反映生化组成,LF-NMR揭示内部结构差异。在线更新策略通过持续吸收新样本知识,使模型适应数据分布漂移,解决了跨年度泛化难题。
Conclusion
该研究构建的"多模态融合-在线更新-可解释分析"框架,不仅为玉米籽粒跨年度鉴定提供了可靠方案(准确率98.63%),其方法论更可推广至其他农作物品种识别。SHAP分析明确的关键特征(如584?nm光谱带、核磁信号Smax)为种子质量检测指标优化提供了理论依据,推动农业检测向智能化、可解释化方向发展。
生物通微信公众号
知名企业招聘