
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度学习赋能高光谱成像实现多品种苹果营养成分高精度无损定量
【字体: 大 中 小 】 时间:2025年09月19日 来源:Frontiers in Plant Science 4.8
编辑推荐:
本研究创新性地将卷积神经网络-双向门控循环单元-注意力机制(CNN-BiGRU-Attention)深度学习架构与高光谱成像(HSI)技术相结合,成功实现了苹果中维生素C(VC)、可溶性固形物(SSC)和可溶性蛋白(SP)的高精度无损检测。该模型利用400-1000 nm范围512个波段的高光谱数据,对六个不同地理来源的苹果品种进行建模,在原始高光谱立方体输入下表现出卓越性能。VC和SSC的全光谱建模获得最佳预测效果(测试集:R2VC=0.891,R2SSC=0.807,RPDVC=3.117,RPDSSC=2.337),SP量化则通过连续投影算法(SPA)选择特征波长(403、430、551、617和846 nm)获得R2=0.848和RPD=2.642。跨年度验证证实了模型的强健性,为多品种水果质量监测提供了可部署的解决方案。
引言
苹果(Malus domestica)作为全球广泛种植的仁果类水果,因其丰富的营养成分和独特的风味特征而成为重要的农业商品。苹果的营养品质和感官特性主要由其可溶性固形物含量(SSC)、抗坏血酸(维生素C,VC)和可溶性蛋白(SP)水平决定。传统量化这些参数的方法包括折射法测定SSC、高效液相色谱(HPLC)或2,6-二氯酚靛酚(DCPIP)滴定法测定VC,以及Bradford比色法测定SP。然而,这些方法具有破坏性、劳动密集型特点,不适合大规模采后质量监测。
高光谱成像(HSI)作为一种智能无损检测方法,近年来已成为一种有前景的技术,具有快速、经济高效和无创分析的优势。HSI技术将空间-光谱特征与化学计量学建模相结合,促进多个质量指标的同时预测,并已成功应用于苹果、香蕉、柑橘、桃子和樱桃等水果。尽管有这些优势,但研究表明,由于环境异质性,HSI模型在跨苹果品种、地理来源或生长季节应用时存在泛化性衰减问题。
传统HSI建模依赖于偏最小二乘回归(PLSR)和支持向量机(SVM),这些方法需要大量的光谱预处理和手动特征选择,缺乏自适应学习能力,对高维光谱-空间数据不足。深度学习(DL)架构,特别是卷积神经网络(CNNs),彻底改变了化学计量学,因为它们能够从原始高光谱立方体中端到端提取分层非线性特征,并消除对手动预处理的依赖。比较研究证实,在复杂的光谱-空间解码任务中,CNNs优于线性方法。
然而,CNNs主要捕获局部特征,在建模光谱数据的序列性质方面效果较差,这些数据通常沿波长轴表现出长程依赖性。为了解决这个问题,我们进一步引入双向门控循环单元(BiGRUs)来增强模型学习前后方向上下文光谱信息的能力。BiGRUs特别适合高光谱应用,因为它们能有效捕获跨光谱带的时间关系,同时保持轻量级结构。与LSTMs等传统循环网络相比,BiGRUs参数更少,收敛更快,计算效率更高,这对于样本量有限和实时处理要求的应用具有优势。这些特性使BiGRUs不仅是方便的选择,而且是功能上适合建模农产品光谱序列的选择。
本研究利用HSI获取2023年来自不同地理区域的六个苹果品种的高光谱数据。我们开发了CNN、CNN-BiGRU和CNN-BiGRU-Attention模型,使用连续投影算法(SPA)进行特征波长选择,预测VC、SSC和SP水平。使用2024年数据集的外部验证证实了模型的稳健性。开发的框架为快速、无损的苹果质量评估提供了理论和技术基础,以应对多品种和跨区域应用中的关键挑战。
材料与方法
研究程序
实验过程的流程图说明了提出的基于深度学习的苹果质量预测系统的示意图工作流程,包括四个核心阶段。首先,在数据采集阶段,使用高光谱成像系统收集苹果的高光谱图像,然后进行白参考校正。通过一系列图像处理步骤提取感兴趣区域(ROIs),包括图像增强、二值分割、连通分量分析、轮廓提取、B样条拟合和平滑,以确保准确检索光谱反射率。第二,在特征选择阶段,结合Savitzky-Golay(SG)预处理和连续投影算法(SPA)提取对质量预测最信息丰富的关键光谱带。第三,在模型构建期间,开发了三种深度学习模型——CNN、CNN-BiGRU和CNN-BiGRU-Attention——基于光谱反射率预测VC、SSC和SP。最后,在模型训练和验证阶段,2023年收集的数据用于模型训练,而2024年的数据作为独立测试集来评估模型稳健性和泛化性能。
实验材料
本研究构建的苹果样本库涵盖中国三个主要产区(新疆;华北;胶东半岛),包括来自六个代表性品种的144个样本,以整合地理起源和遗传资源的双重异质性。时空分层设计包括以下三个地理标志品种:新疆阿克苏红富士(AKS)、河北顺平红富士(SPFS)和山东烟台红富士(YTFS),以及三个非地理标志品种——樱桃苹果(YT)、国光苹果(GG)和花牛苹果(HN)。样本在2023-2024生长季节收集,2023年收集96个基线样本,2024年收集48个额外验证样本。该框架有效平衡了品种遗传背景、区域气候特征和收获时间变量,为可泛化光谱建模提供了稳健的数据支持:2023数据集分为训练和测试集(7:3比例),2024数据集作为外部验证集。
生理参数测定
VC量化:将1.0 g苹果样品在研钵中用5 mL 2%草酸溶液匀浆。将匀浆定量转移至10 mL容量瓶,用草酸溶液稀释至刻度,然后过滤。用标准化2,6-DCPIP溶液滴定10 mL抗坏血酸标准溶液(0.1 mg/mL)直至达到持久玫瑰红色终点(15秒稳定性),记录染料消耗以标准化滴定剂。此后,类似地滴定5 mL样品滤液,基于染料消耗计算VC含量。
SSC测量:按照NY/T 2637-2014(水果和蔬菜产品 - 折射法测定可溶性固形物),将三个2毫米厚的果肉片堆叠(总厚度:3毫米)并使用液压压榨机(5 kN)榨汁。使用PR-101α数字折射仪(Atago Co., Japan)对过滤后的果汁(80目筛)进行三次分析,记录三次测量(每片两侧)的平均值作为最终SSC值。
SP测定:将0.5 g样品与2.0 mL蒸馏水匀浆并离心(4,000 ×g,10分钟)。将上清液稀释(0.20 mL上清液 + 0.80 mL水)并与5.00 mL考马斯亮蓝G-250染色溶液反应2分钟。使用UV-1800分光光度计(Shimadzu, China)测量595 nm处的吸光度,通过牛血清白蛋白标准曲线确定SP浓度。
高光谱成像采集与光谱数据处理
高光谱成像系统:使用推扫式高光谱成像系统(HG101, Nakagawa Photonics, China)进行高光谱数据采集,其覆盖395-1008 nm的光谱范围,光谱分辨率为2.8 nm,获取360个连续波段。成像系统配备双光源照射模块——两个150 W光纤卤素灯对称放置在样品台两侧,高度250 mm,与样品平面形成45°照射角,以确保超过95%的表面照明均匀性。实验前严格执行30分钟预热程序,以确保检测器在395-1008 nm波长范围内达到热平衡,并最小化暗电流噪声干扰。为消除外部因素和仪器效应,在光谱提取前使用白参考板校正原始高光谱图像。
光谱数据提取和预处理:白参考校正后,使用基于阈值的方法分割单个苹果区域以获得完整高光谱图像。然后提取360个波段的光谱反射率数据,计算所选ROI内的平均反射率作为每个样品的原始光谱数据,产生相应的波长-反射率曲线。为提高区域提取的准确性,采用了一种集成光谱差异信息和基于B样条的轮廓建模方法,用于高光谱图像中的精确目标分割和拟合。这种方法有几个优点:通过利用光谱对比增强目标边界;自动选择最大连通分量,确保高稳健性;使用B样条拟合改善轮廓的几何连续性和平滑度;并为进一步分析提供清晰直观的视觉输出。该预处理工作流程实现了准确且可解释的目标提取,为后续特征选择和模型构建提供了高质量的输入数据。
光谱数据预处理:光谱预处理是化学计量学中一种关键的数据优化方法,有效去除与目标变量无关的干扰信号,同时增强有效光谱特征。在本研究中,SG平滑作为唯一的预处理方法应用,以抑制随机光谱噪声并保留局部信号趋势。与严重依赖光谱校正技术(如标准正态变量和乘性散射校正)的传统化学计量学模型不同,提出的深度学习架构(CNN、CNN-BiGRU和CNN-BiGRU-Attention)结合了内部归一化机制(例如,批量归一化和通过反向传播的权重调整)。因此,未应用额外的散射校正方法以避免冗余归一化和潜在信息丢失。基于局部加权最小二乘原理的SG卷积平滑方法,通过在滑动时间窗口内构建多项式拟合模型来抑制高频噪声。该方法通过参数化调整窗口宽度和多项式阶数,自适应消除光谱数据中的随机噪声干扰,同时保留原始信号波形特征。
特征提取:在光谱检测中,获取数据的高维性和复杂性通常导致信息冗余或模型过拟合。为解决这个问题,引入了SPA进行特征波长选择。SPA是一种高效的特征波长筛选方法,有助于从高维数据中提取信息丰富且非冗余的光谱带。该算法采用迭代策略,即初始选择光谱矩阵中方差最大的波长以优先考虑最信息丰富的区域,然后计算剩余波长在所选带空间中的正交投影,以识别具有最大投影值的波长纳入特征集。在本研究中,选择SPA主要基于其在类似高光谱建模任务中已证明的有效性,以及其计算效率和产生紧凑、可解释特征子集的能力,适合深度学习模型输入。
具体而言,本研究中的SPA程序分三个阶段执行以确保稳定性和可重复性。第一阶段,所有光谱变量标准化为零均值和单位方差。每个变量用作初始投影点,通过正交投影生成候选子集,迭代次数范围从最小5到最大360个波长。第二阶段,使用基于独立验证集的预测残差误差平方和(PRESS)准则评估所有子集。通过产生最低PRESS值的组合确定最优子集。第三阶段,根据从回归系数和变量标准偏差得出的相关性指数对变量进行排序,并使用F检验(α = 0.25)选择最终子集,以确保附加变量不会显著增加预测误差。
模型构建
本研究采用CNN、CNN+BiGRU和CNN+BiGRU+Attention模型预测苹果VC、SSC和SP水平。原始光谱和预处理数据用作输入参数建立定量预测模型。全光谱和特征选择波段作为自变量,而VC、SSC和SP作为因变量。
CNN模型通过卷积和池化操作有效识别局部空间-光谱特征。输入光谱向量重塑为大小为[n × 1 × 1]的伪图像,其中n是所选波长数。网络包括两个卷积层,内核大小为[3×1],过滤器大小分别为8和32,每个后面跟着批量归一化、ReLU激活和[2×1]最大池化。应用丢弃率为0.4的dropout层进行正则化。然后输出通过两个全连接层(具有32和1个神经元)和一个回归层进行最终预测。该模型实现了自主特征学习并捕获光谱域中的局部非线性结构。
CNN-BiGRU模型通过合并BiGRU来增强CNN,以捕获光谱数据中的全局依赖性和序列模式。架构包括两个并行分支:一个CNN流,具有卷积层(16个过滤器,[3×1]内核)、批量归一化、ReLU、[3×3]最大池化、展平和一个具有25个神经元的全连接层;以及一个BiGRU流,具有两个GRU层(每个35个隐藏单元),通过翻转层处理原始和反转序列。两个分支的输出被连接并传递到回归层。双向设计能够同时分析短到长和长到短波长关系,揭示跨吸收峰和基线漂移的相互作用。
为进一步加强光谱特征表示,CNN-BiGRU-Attention模型在特征连接步骤后合并了自注意力机制。采用单头自注意力层(键和查询维度=50)使用点积注意力动态分配权重给光谱分量。这种一维卷积、双向时间建模和自适应注意力的集成使网络能够专注于最信息丰富的光谱区域,同时抑制噪声。
所有模型使用Adam优化器训练。CNN模型训练500个周期,初始学习率0.001,L2正则化因子0.01。对于更复杂的CNN-BiGRU和CNN-BiGRU-Attention模型,训练延长至1000个周期,初始学习率更高为0.01。应用学习率衰减策略,在600-800个周期后以0.1的因子降低学习率。
这些训练配置根据每个模型的结构复杂性和收敛行为精心定制,以实现最佳性能和泛化。例如,CNN模型具有相对浅的架构和更少的参数,在中等学习率(0.001)和较短训练持续时间(500个周期)下有效收敛。相比之下,引入顺序学习和注意力机制的CNN-BiGRU和CNN-BiGRU-Attention模型具有更深的结构和更高的参数计数。这些模型需要更大的初始学习率(0.01)和更长的训练(1000个周期)以完全收敛。在周期600后引入学习率衰减以稳定优化并防止微调阶段的过冲。这些设置通过初步试验和经验调整确定,平衡训练速度、过拟合风险和预测准确性。
模型评估指标
通过筛选苹果VC、SSC和SP定量预测的光谱回归模型,建立了一个多维评估框架以平衡数值准确性和模型稳健性。R2测量参考数据中由模型解释的方差比例。值越接近1表示拟合越好。方程如下所示。
其中yi是实际测量的样本值,?i是预测的样本值,?是平均实际测量的样本值,n是集合中的样本数。
均方根误差(RMSE)评估预测误差的平均幅度。较低的RMSE表示较高的准确性。数学表达如下所示。
其中yi是实际测量的样本值,?i是预测的样本值,n是集合中的样本数。
RPD是参考值的标准偏差与RMSE的比率。它反映了模型的稳健性和泛化性。通常,RPD > 2.0表示良好的预测性能,而RPD ≤ 1.4表示弱预测。RPD表达如下所示。
其中SD表示测量值的标准偏差。
统计分析
使用SPSS软件(v23.0; SPSS Inc., Chicago, USA)进行单向ANOVA,并使用Duncan多重范围检验(p < 0.05)评估处理之间的显著差异。
结果与讨论
分析
对2023年收集的96个苹果样本的VC、SSC和SP水平进行了系统分析。结果揭示了显著的品种差异:YT具有最高的VC含量(3.27 ± 0.67 mg/100 g, p < 0.05),而GG具有最低的VC水平(1.08 ± 0.38 mg/100 g)。大多数品种之间未观察到SSC水平的显著差异(p > 0.05),除了YTHFS和SPHFS。值得注意的是,HN苹果表现出比其他品种高27-40%的SP含量(0.51 ± 0.08 mg/g, p < 0.05)。
地理分析表明,与YTHFS和SPHFS相比,AKS的VC和SSC水平显著更高(p < 0.05)。这可能归因于阿克苏独特的生态因素,如昼夜温度变化和年日照时长。红富士苹果之间未观察到显著的SP差异。
化学指数在四个品种和三个农业生态区的广泛分布为高光谱建模建立了必要的化学梯度和生物多样性,VC水平为1.08-3.27 mg/100 g,SSC为8.48-11.92%,SP水平为0.32-0.51 mg/g。
六个来自不同地理起源的苹果品种的可见-近红外(Vis-NIR)光谱反射特性显示,HN苹果在400-600 nm可见范围内的反射率显著低于其他品种,可能是由于其更深的表皮色素沉积。尽管其他品种的反射值有微小波动,但它们的光谱曲线整体保持相似的形态趋势。
观察到的不同品种之间的光谱变化与其内在生理特性密切相关。400-700 nm范围内的明显反射差异在不同地理起源和品种之间特别明显,可能是由于色素组成的变化,特别是花青素和叶绿素含量。花青素在400-675 nm光谱区域表现出最大敏感性,浓度升高对应反射率降低;我们的实验数据证实了这一发现。大约680 nm处的反射变化主要源于叶绿素含量差异,而970 nm处的光谱波动与苹果组织中的水分变化相关,这对应于O-H伸缩振动的第三泛音吸收带。
预处理后的SG平滑光谱显示与原始数据相比光谱平滑度显著增强。
特征波长提取
原始光谱数据中相邻波段之间的狭窄间隔通常导致大量数据冗余。为解决这个问题,采用SPA进行特征波长提取。所选特征波长跨越整个波数范围。具体而言,SPA为原始数据中的VC、SSC和SP参数识别了5、33和5个光谱变量作为特征波长,但预处理数据中相应参数选择了13、11和5个变量。这种特征提取方法不仅保留了关键光谱信息,而且有效减轻了变量间相关性。
基于先前的光谱研究,许多所选波长对应于已知的O-H和C-H基团的吸收特征,这些与苹果中糖、有机酸和多酚的存在相关。特别是700-950 nm附近的区域已被广泛报道与SSC和维生素C含量相关,因为它们反映了O-H伸缩的第三泛音和水分吸收特性。许多用于SP预测的所选波长对应于O-H、C-H和N-H键的特征吸收带,这些常见于可溶性蛋白及其组成氨基酸中。可见波段可能反映蛋白质与发色团或色素的相互作用。红色区域与氨基酸特征相关,而近红外波段围绕846 nm,尤其是974和994 nm,与O-H和N-H伸缩振动的泛音吸收相关,这些是蛋白质结构中的典型特征。
在本研究中,选择SPA进行特征波长提取是因为其在减少多重共线性和低计算成本方面的效率。虽然SPA在选择紧凑的信息变量子集方面已证明有效,但替代方法如遗传算法、基于随机森林的重要性排序或竞争性自适应重加权采样在高光谱特征选择任务中也显示出前景。这些方法在捕获全局或非线性关系方面可能提供潜在优势,但可能需要广泛的参数调整或计算资源。未来的研究可以调查这些方法的比较有效性或探索混合策略以增强模型性能和可解释性。
建模结果分析
进行了系统评估,以评估CNN、CNN+BiGRU和CNN+BiGRU+Attention在四种光谱输入配置(RAW、SG、SPA + RAW、SPA + SG)下对苹果VC、SSC和SP参数的预测性能。混合CNN+BiGRU+Attention架构展示了优于单独CNN的建模能力。对于维生素C预测,它实现了训练和测试集R2值分别为0.899和0.891,RPD值持续超过3.100。在SSC量化中,保持了可靠的性能(测试集R2 = 0.807,RPD = 2.337)。值得注意的是,该模型通过有效的光谱特征集成实现了对可溶性蛋白的增强预测准确性(测试集R2 = 0.848,RPD = 2.673)。这种性能增强归因于其多模态特征提取机制——BiGRU建立沿前向-反向波长维度的长程上下文依赖关系,而注意力机制通过可训练权重矩阵动态放大对质量参数关键的特征波长,最终形成生化可解释的特征表示。
在质量参数之间观察到光谱输入配置的明显敏感性模式。VC和SSC预测的最佳模型利用原始光谱输入(RAW+CNN+BiGRU+Attention),证实了深度网络通过分层非线性变换的自主特征提取能力。相比之下,SP预测需要SPA特征选择(SPA+RAW+CNN+BiGRU+Attention),其中优化输入维度有助于聚焦建模在403、430、551、617和846 nm的特征吸收带上,有效减轻高维数据中的噪声干扰。原始光谱输入在所有最佳模型中系统地优于SG对应物,与传统光谱分析范式形成对比。这种现象表明,深度神经网络通过自适应特征学习保留原始数据中复杂的非线性相关性,而过度平滑可能破坏光谱响应与蛋白质含量之间的动态耦合关系。
外部验证
为评估最佳模型的泛化稳健性,实施了跨年度和跨品种的外部验证协议。最初在2023数据集上训练的CNN+BiGRU+Attention架构,使用独立2024样本集进行验证,该集合包括四个品种和三个地理起源。外部验证产生了稳健的性能指标:VC、SSC和SP的R2和RPD值均表现良好。比较分析显示,与先前测试集性能相比性能略有降低,但所有RPD值均超过基准阈值2.00,证实模型在不同年份间保持了稳定的光谱-成分映射关系及其跨年度工业适用性。
提出的CNN-BiGRU-Attention模型为苹果质量无损检测提供了一个创新框架。未来研究可以从多个维度深化其工业应用。首先,应引入可解释深度学习框架定量分析不同光谱带对预测VC、SSC和SP的贡献率,并识别与化学成分直接相关的特征吸收峰。这将增强模型决策的透明度,并为便携式传感器设计提供光谱带优化指导。其次,应整合苹果生长环境的多模态数据,结合光谱数据与温度、湿度、光照和土壤养分参数,建立“环境-质量”关系,并通过跨模态注意力机制对齐环境时间特征与光谱响应。第三,应通过神经网络剪枝和量化感知训练技术压缩模型规模,开发轻量级苹果质量分级系统。
结论
本研究建立了一个基于Vis-NIR光谱的CNN-BiGRU-Attention深度学习框架,实现了跨六个品种和地理起源的苹果质量参数(VC、SSC和SP)的高精度预测。通过协同整合CNN的局部特征提取能力、通过BiGRU的长程波长依赖性建模以及通过注意力机制动态增强关键光谱区域,该模型在原始光谱输入下展示了卓越性能。VC和SSC实现了最佳全光谱预测,但SP量化需要补充SPA以专注于化学信息丰富的波段。比较分析显示,与SG数据相比,原始光谱的直接建模显著提高了非线性模式识别效率,表明深度架构的自主特征优化能力。
使用独立2024数据集的跨年度外部验证证实了模型稳健性,VC、SSC和SP的R2值分别为0.829、0.779和0.835,同时保持RPD值持续高于2.0。这些结果验证了跨时间和空间变化的光谱-成分映射的可靠性。提出的框架为无损水果质量评估提供了一个可扩展的深度学习解决方案,展示了在多品种和跨区域场景中的显著工业应用潜力。未来研究应扩大样本量并纳入更多品种,以进一步增强不同农业条件下的预测稳健性。
生物通微信公众号
知名企业招聘