突破传统!VIS-NIR 光谱结合机器学习,开启高粱营养成分无损速检新时代

【字体: 时间:2025年02月20日 来源:Scientific Reports 3.8

编辑推荐:

  为解决高粱营养成分传统检测方法的弊端,山西农业大学高粱研究所的研究人员开展基于 VIS-NIR 高光谱技术检测高粱营养成分的研究。结果构建出有效检测模型,实现无损速检。推荐科研读者阅读,了解前沿检测技术。

  
高粱,作为全球第五大谷类作物,在干旱和半干旱地区广泛种植。它的籽粒富含淀粉、蛋白质、单宁、脂肪和氨基酸等多种营养成分,这些营养成分的差异,决定了高粱在食品制造、饲料加工和酿造等不同行业的应用。就好比不同 “性格” 的高粱,在各自擅长的领域发挥着独特作用。然而,想要准确了解高粱中的营养成分,却不是一件容易的事。

传统的化学检测方法虽然能给出精确的量化结果,但存在诸多弊端。比如,样品制备过程复杂,就像一场繁琐的 “化学实验秀”,需要花费大量时间和精力;成本高昂,每次检测都像是在 “烧钱”;而且检测过程具有破坏性,检测完后高粱样品就 “牺牲” 了,无法再用于其他用途。更让人头疼的是,传统方法一次只能检测一种营养成分,就像一个慢吞吞的 “单任务小能手”,效率极低,这些缺点严重限制了它的广泛应用。

为了解决这些难题,山西农业大学高粱研究所的研究人员在《Scientific Reports》期刊上发表了一篇名为《Visible near-infrared hyperspectral technology combined with machine learning for rapid and nondestructive detection of nutritional components in sorghum》的论文。他们通过研究,成功找到了能检测高粱营养成分的有效方法,这一成果意义重大,为高粱营养成分的检测开辟了新道路,也为食品营养评估提供了重要依据。

在这项研究中,研究人员主要运用了以下几个关键技术方法:首先是可见近红外(VIS-NIR)高光谱技术,就像给高粱做了一场 “光谱体检”,能够获取高粱的光谱信息;接着使用了多种数据处理算法,比如竞争自适应重加权采样(CARS)、自举重采样软收缩(BOSS)和迭代保留信息变量(IRIV)算法,这些算法就像是数据的 “筛选大师”,能从大量数据中精准找出关键信息;最后利用偏最小二乘法(PLS)、反向传播(BP)神经网络和极限学习机(ELM)建立检测模型,这些模型就是预测高粱营养成分的 “智慧大脑”。

下面我们来看看具体的研究结果:

  • 营养成分分析:研究人员收集了 93 个高粱品种的 279 个样本,对这些样本中的粗蛋白、单宁和粗脂肪含量进行了化学分析。结果发现,粗蛋白平均含量为 9.45%,单宁为 1.15%,粗脂肪为 3.88%。而且不同品种的高粱,营养成分差异很大,就像不同的高粱有着各自独特的 “营养密码”。比如粗蛋白含量在 7.21% - 14.39% 之间波动,单宁含量从 0.04% 到 2.56% 不等,粗脂肪含量则在 2.67% - 5.93% 之间变化。这些差异表明,高粱品种间的营养丰富度各不相同,也说明研究人员选取的样本具有很好的代表性,为后续研究奠定了坚实的数据基础。
  • 光谱特征分析:研究人员观察了 279 个高粱样本在 VIS-NIR 光谱范围内的光谱曲线。发现在 VIS 范围内,不同高粱品种的光谱反射率差异明显,这主要是因为种子颜色不同,就像不同颜色的衣服对光的吸收和反射不一样。有些高粱在 650 - 680nm 处有明显的光谱低谷,这是因为它们含有深色发色团。在 NIR 范围内,虽然光谱形状相似,但反射率值有差异。这些光谱差异反映了不同高粱品种营养成分的不同,为分析和检测高粱成分提供了重要线索。研究人员还对光谱数据进行了预处理,用标准正态变量变换(SNV)、去趋势(Detrending)和多元散射校正(MSC)算法处理后,发现光谱数据质量明显提高,更有利于后续建模。同时,他们用 SPXY 算法将样本合理地分成了校准集和预测集,为分析和预测高粱化学成分做好了充分准备。
  • 特征变量分析:研究人员用 CARS 和 BOSS 算法提取与粗蛋白、单宁和粗脂肪相关的特征波长。在这个过程中,他们发现随着算法迭代次数增加,均方根误差(RMSE<sub>CV</sub>)会先减小后增大。当 RMSE<sub>CV</sub>达到最小值时,就确定了相应的特征波长数量。比如,用 CARS 算法提取粗蛋白特征波长时,41 次迭代后 RMSE<sub>CV</sub>最小,选了 63 个波长;用 BOSS 算法时,6 次迭代后 RMSE<sub>CV</sub>最小,选了 73 个波长。之后,他们再用 IRIV 算法对这些波长进行优化,得到了更精准的特征波长组合。像粗蛋白最终确定了 41 个特征波长,这些波长与蛋白质分子中芳香氨基酸的光相互作用、蛋白质的二级结构等有关;单宁确定了 38 个特征波长,与单宁分子的电子跃迁、振动模式等相关;粗脂肪确定了 22 个特征波长,与脂肪酸的双键、共轭结构、振动吸收等密切相关。这种粗细结合的特征变量提取策略,有效减少了变量数量,还保留了关键信息,为后续建模提供了优化基础。
  • 检测模型比较:研究人员分别用 PLS、BP 和 ELM 三种方法,基于全光谱数据、粗子集数据和优化后的细子集数据建立检测模型。结果发现,基于特征光谱数据建立的模型,性能大多优于全光谱模型。比如 CARS-PLS 模型,相比全光谱模型,粗蛋白和粗脂肪的 R<sub>p</sub>2和 RPD<sub>p</sub>增加,RMSE<sub>p</sub>减小,不过单宁模型性能稍有下降。但经过 IRIV 算法进一步优化后,所有模型性能都得到了提升。最终确定了最佳检测模型,CARS-IRIV-PLS 模型适合检测粗蛋白,R<sub>p</sub>2为 0.69,RMSE<sub>p</sub>为 0.80%,RPD<sub>p</sub>为 1.80;BOSS-IRIV-PLS 模型适合检测单宁,R<sub>p</sub>2为 0.88,RMSE<sub>p</sub>为 0.22%,RPD<sub>p</sub>为 2.84;BOSS-IRIV-ELM 模型适合检测粗脂肪,R<sub>p</sub>2为 0.61,RMSE<sub>p</sub>为 0.32%,RPD<sub>p</sub>为 1.61。这表明这些模型能有效预测高粱中的营养成分含量。

总的来说,这项研究利用 VIS-NIR 光谱技术和化学测定方法,对高粱的关键营养成分进行了深入研究。通过 CARS-IRIV 和 BOSS-IRIV 关键波长提取算法,成功消除了大量冗余数据,提取出了与粗蛋白、单宁和粗脂肪相关的特征波长,并建立了相应的检测模型。这些模型实现了对高粱籽粒中营养成分的实时、无损检测,为光谱技术在其他谷物成分检测中的应用提供了理论支持和指导。研究人员还计划将多个独立模型整合为一个综合模型,结合大数据分析和人工智能技术,构建谷物营养成分实时检测系统,这将大大提高检测效率,保障谷物质量安全,在复杂的工业生产过程中,对同时检测多种谷物营养成分具有巨大的应用潜力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号