基于迁移学习的可见-近红外光谱技术优化茶叶含水率预测模型研究

【字体: 时间:2025年06月19日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  本研究针对传统茶叶含水率检测方法破坏样本、效率低下的问题,提出基于可见-近红外光谱(VIS-NIR)与迁移学习的创新解决方案。研究人员通过FD+SNV+CARS+ε-SVR模型构建高精度预测体系(Rp =0.903),并创新性应用堆叠集成学习与实例迁移学习技术,仅需55个迁移样本即可将跨年度数据预测性能(RP )从0.138提升至0.851,为农业无损检测提供了样本高效利用的新范式。

  

茶叶作为全球三大饮料之一,其品质与叶片含水率密切相关。传统检测方法如烘干法耗时耗力,电测法误差显著,而核磁共振技术又存在专业门槛高的问题。面对这些技术瓶颈,可见-近红外光谱(VIS-NIR)技术以其快速、无损的优势崭露头角,但在实际应用中仍面临模型跨批次泛化能力不足的挑战——当2024年建立的优异预测模型(Rp
=0.903)直接应用于2022年样本时,预测性能骤降至0.138,这暴露出光谱模型在农业实际应用中的关键短板。

浙江省自然科学基金资助项目的研究团队以"龙井43"为研究对象,创新性地将迁移学习引入农业光谱分析领域。研究首先采集两批次共484份样本(2022年135份,2024年349份),在500-870nm光谱范围内,通过比较FD(一阶微分)、SNV(标准正态变量变换)等预处理方法,结合CARS(竞争性自适应重加权采样)特征选择,构建了ε-SVR(支持向量回归)最优预测模型。为突破模型跨年泛化障碍,研究团队平行尝试了堆叠集成学习(需60样本)和实例迁移学习(仅需55样本)两种优化策略,最终使跨年预测性能提升6倍以上。

实验材料与方法
研究选取杭州西湖区龙坞茶村的"龙井43"茶树鲜叶,覆盖不同叶位的2-3片茶叶以增强样本代表性。光谱采集使用便携式VIS-NIR光谱仪,通过对比PLSR(偏最小二乘回归)、SVR等算法性能,确定ε-SVR为基准模型。迁移学习采用TrAdaBoost算法实现源域(2024年)向目标域(2022年)的知识迁移。

关键研究发现

  1. 光谱特征差异:550nm、720nm和870nm处出现显著吸收峰,与茶叶中水分特征振动相关;
  2. 预处理组合优势:FD+SNV预处理使预测Rc
    达0.9676,较原始光谱提升23%;
  3. 迁移学习效率:仅需55个目标域样本即可实现RP
    =0.851,较传统方法减少92%的标定样本量;
  4. 经济性对比:迁移学习的样本需求比堆叠集成少8.3%,但预测精度相当(0.851 vs 0.85)。

结论与展望
该研究首次证实实例迁移学习在农业光谱模型优化中的显著优势,其"小样本适配"特性特别适合农产品检测场景。技术层面,研究建立的FD+SNV+CARS+ε-SVR框架为茶叶含水率检测提供了新标准(RMSEC=0.0221);方法论层面,提出的双路径优化策略为农产品质量无损检测模型的跨时空迁移提供了普适性方案。未来可进一步探索迁移学习在茶叶其他品质参数(如茶多酚含量)预测中的应用,推动农业光谱技术向"少样本、高泛化"方向发展。论文发表于《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》,为农业分析化学领域提供了重要的技术参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号