基于近红外光谱与机器学习优化的甘蔗茎秆品质动态监测新方法

【字体: 时间:2025年09月10日 来源:Industrial Crops and Products 6.2

编辑推荐:

  推荐:本研究针对传统近红外光谱(NIRS)模型在甘蔗低糖品种和早期生长阶段预测精度不足的问题,通过整合多发育阶段样本(200茎样)和优化建模策略(PLS/ANN/MLP/CNN),建立了高精度蔗糖(ANN模型R2cv=0.99,RPD=10.18)及还原糖预测体系,显著降低异常值比例(葡萄糖干重异常值从23.56%降至2.30%),为甘蔗全生育期品质监测和种质筛选提供了可靠工具。

  

甘蔗作为全球最重要的糖料和能源作物,其茎秆品质直接决定产业效益。然而,传统检测方法难以应对甘蔗生长过程中复杂的品质动态变化——在伸长期以还原糖(葡萄糖、果糖)为主,成熟期转为蔗糖主导,且纤维含量随发育持续积累。这种时空异质性给供应链质量控制带来巨大挑战。虽然近红外光谱(NIRS)技术具有快速无损优势,但现有模型多基于成熟期样本开发,对低糖品种或早期生长阶段的预测误差高达75%,严重制约其在全生育期监测中的应用。

广西大学研究团队在《Industrial Crops and Products》发表的研究中,创新性地整合伸长期至成熟期的200个茎样(覆盖40个种质),结合化学计量学与深度学习算法,构建了覆盖甘蔗全生长周期的品质预测体系。研究采用动态NIRS扫描(4000-12000 cm-1)、HPAEC-PAD糖分检测作为金标准,通过PLS(偏最小二乘)和ANN(人工神经网络)等算法优化模型,并利用6年田间试验数据(337个种质)验证稳定性。

3.1 现有NIRS模型的局限性

通过测试不同生长阶段样本,发现原模型对伸长期样本的还原糖预测存在系统性低估(p<0.001),葡萄糖干重异常值达55.26%-75%,而成熟期样本异常率降至29.27%-39.02%,证实模型存在明显的发育阶段依赖性。

3.2 数据变异扩展

新增样本使蔗糖干重范围从25.61-61.89 g/100g扩展至3.50-62.25 g/100g,变异系数(CV)从0.11增至0.23。PCA分析显示合并数据集的主成分解释率达94.6%,光谱多样性显著提升。

3.4 PLS模型优化

优化后PLS模型的交叉验证R2cv提升显著:还原糖从0.74→0.92(RPD 1.98→3.62),蔗糖从0.83→0.96(RPD 2.49→5.27)。鲜重水分预测达R2cv=0.99,RPD=9.86,异常值比例降为0%。

3.5 ANN模型优势

ANN在干重还原糖预测中表现最优(R2cv=0.96-0.97,RPD=4.95-5.75),较PLS提升18%。鲜重蔗糖预测R2cv达0.99,RPD创10.18的记录,Bootstrap覆盖率达95.27%,区间宽度缩减30%。

3.7 六年应用验证

对337个种质的长期监测显示,ANN模型使干重蔗糖异常值显著降低(p<0.05)。高/低糖种质群间蔗糖含量差异稳定(干重53.92% vs 44.84%,p<0.01),年际相关性r>0.85。

该研究突破了NIRS技术在甘蔗早期生长阶段的应用瓶颈,建立的ANN模型对蔗糖预测精度接近理论极限。通过整合多时相光谱数据与非线性建模,不仅为甘蔗育种提供高效表型分析工具(每年可筛查300+种质),更创新性地构建了覆盖"伸长-成熟-衰老"全过程的品质动态预测框架。研究揭示的甘蔗糖分积累规律(伸长期还原糖占比>70%,成熟期蔗糖占比>85%),为制定精准采收标准和糖厂原料分级提供了数据支撑。这种"光谱-生长-环境"多模态分析范式,可推广至其他作物品质监测领域,推动农业检测技术向智能化发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号