将茶芽堆结构信息与非成像高光谱数据分离,以实现精确的单芽生物化学成分反演

《Artificial Intelligence in Agriculture》:Decoupling tea-bud heap structure from non-imaging hyperspectral spectra for accurate single-bud trace biochemistry retrieval

【字体: 时间:2025年11月07日 来源:Artificial Intelligence in Agriculture 12.4

编辑推荐:

  准确、实时、非破坏性估算单芽生化特性的关键是管理绿茶品质,但任意堆叠芽的宽谱测量受混合叶面/背面的结构干扰和三维排列影响。我们提出Bilinear Spectral Derivative Gaussian Process Regression(BSDGPR),通过结合双线性光谱导数模型与高斯过程回归,最小化结构干扰。首先,一阶和二阶光谱导数衰减叶空间排列项(R_LSA),而单位球面归一化与弦距径基函数核消除叶前面积分数(f)的影响,使堆叠光谱标准化为单芽等效。实验表明,BSDGPR相比传统反射域GPR在茶多酚(R2从0.68提升至0.81,NRMSE降低3-5个百分点)、氨基酸(R2从0.56提升至0.71)和可溶性糖(R2从0.86提升至0.91)的预测精度上均有显著提升,同时保持近实时推理(10-13秒/模型)。该方法还表现出跨尺度(芽堆→冠层)和跨品种的泛化能力。

  这项研究提出了一种名为Bilinear Spectral Derivative Gaussian Process Regression (BSDGPR)的新方法,旨在解决在非成像光谱数据中对任意堆叠茶芽进行非破坏性生化成分估计的问题。当前的光谱测量技术在农业领域具有重要应用,尤其是在绿茶质量管理和生化成分分析方面。然而,当测量对象是叠放的茶芽时,由于叶片表面混合和三维结构的影响,光谱数据中存在结构干扰,这会降低生化成分估计的准确性。为了克服这一问题,研究团队设计了一种物理上可解释的模型,该模型结合了双线性光谱导数模型和高斯过程回归,以减少结构干扰,提高估计精度。

研究的核心在于光谱导数的使用,以及通过单位球归一化和弦距离径向基函数(RBF)核来消除与叶片前视面积分数相关的增益变化。这些处理方式使得堆叠茶芽的光谱数据能够被标准化为单芽等效数据,从而为生化成分的估计提供更准确的输入。通过对比实验发现,BSDGPR在茶多酚、氨基酸和可溶性糖的预测中,相较于传统的反射域高斯过程回归(GPR)方法,R2提高了0.13,而归一化均方根误差(NRMSE)降低了3至5个百分点。这一改进显著提升了模型的性能,并且在模型推理速度方面也表现良好,适合在近实时应用中使用。

此外,研究还评估了BSDGPR在不同测量尺度和传感器配置下的可迁移性。结果表明,该模型不仅能够从茶芽堆扩展到整个植株冠层,还能在不同茶品种间保持良好的预测能力。对于小麦冠层叶绿素的预测,BSDGPR也表现出了较高的R2值和较低的NRMSE,显示出其在不同作物间的适用潜力。这些发现表明,BSDGPR不仅适用于绿茶,还有望在其他作物的生化成分监测中发挥作用。

研究团队还分析了BSDGPR在不同传感器分辨率下的表现。结果显示,在典型分辨率(≤10-15纳米)下,该模型具有良好的跨传感器迁移能力。然而,在更粗糙的分辨率下,模型的性能会有所下降,特别是对于使用二阶导数的BSDGPR-SD方法。因此,在实际应用中,如果传感器分辨率较低,建议使用一阶导数的BSDGPR-FD方法,或者通过分辨率匹配和有限校准来维持精度。

在方法学上,BSDGPR的创新之处在于其将物理模型与机器学习方法相结合。首先,通过双线性光谱导数模型(BSDM)来消除结构干扰,其次,利用单位球归一化和弦距离RBF核来确保模型对叶片前视面积变化具有不变性。这种物理引导的模型设计不仅提高了预测的准确性,还增强了模型的鲁棒性,使其能够适应不同环境和作物类型的复杂光谱数据。

实验结果显示,BSDGPR在多个方面表现出显著优势。例如,它能够有效抑制与叶片空间排列相关的结构效应,从而提高生化成分估计的可靠性。同时,该模型在不同测量尺度和传感器配置下的表现也表明了其广泛的适用性和迁移能力。对于不同品种的茶芽堆和冠层数据,BSDGPR均能提供稳定的预测结果,这为在农业生产中进行实时、非破坏性的生化成分监测提供了可靠的技术支持。

然而,研究也指出了该方法的一些局限性。首先,当模型从单一品种转移到多个品种时,由于生化成分和结构的异质性,预测精度会有所下降。尽管NRMSE仍然控制在23%以内,但为了提高模型的适用性,需要考虑使用多品种数据集或进行少量重新校准。其次,传感器分辨率对BSDGPR的影响较大,尤其是在使用二阶导数时,粗糙的分辨率会导致较高的误差。因此,在实际应用中,建议使用一阶导数或进行适当的分辨率匹配和校准。此外,研究还指出,如果场景中存在茎、花或土壤背景的强贡献,可能会引入额外的不确定性,因此需要考虑这些因素的建模或屏蔽。

综上所述,BSDGPR为农业中的非破坏性生化成分监测提供了一种物理引导的、数据高效的路径,支持在田间进行精准的质量管理和决策支持。该方法不仅适用于绿茶,还具有在其他作物中的应用潜力,有助于实现农业自动化和精准农业中的实时决策。未来的研究可以进一步验证该方法在更多茶品种和其他作物中的适用性,从而推动其在农业领域的广泛应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号