《Food Analytical Methods》:Emerging Non-destructive Technologies for Indirect Assessment and Prediction of Physical and Physicochemical Quality of Corn Grains as an Alternative to Physical Classification
编辑推荐:
玉米是全球农业综合企业中的主要作物之一,其广泛应用要求采用更快速、更高效的分级方法来评估籽粒质量。基于目视标准的传统物理分级方法存在局限性,这进一步强化了将无损技术与机器学习(ML)模型结合使用的必要性。本研究旨在评估并预测不同分级与组别玉米籽粒的理化品质,通
玉米是全球农业综合企业中的主要作物之一,其广泛应用要求采用更快速、更高效的分级方法来评估籽粒质量。基于目视标准的传统物理分级方法存在局限性,这进一步强化了将无损技术与机器学习(ML)模型结合使用的必要性。本研究旨在评估并预测不同分级与组别玉米籽粒的理化品质,通过光学方法整合高光谱与理化数据,重点在于推动分级流程现代化。不同品种的完整玉米籽粒先被人工分为商业类别(I型、II型、III型和型外)并归入软质玉米与硬粒玉米组。采用近红外反射光谱(NIRS)测定样品的理化参数,随后利用高光谱传感器(Vis–NIR-SWIR,350–2500 nm)进行评价。将所生成的数据加以整合,以探索品质与光谱行为之间的关系,并应用6种机器学习(ML)模型预测相关属性,采用交叉验证并以相关系数与平均绝对误差评估模型性能。常规组分分析显示,不同组别与分级之间存在差异,其中I型样品的淀粉含量较高,而粗蛋白更主要与组别相关。脂质、纤维和灰分仅表现出轻微变化。光谱分析表明,籽粒物理结构对反射模式具有直接影响,从而能够区分不同组别和分级。机器学习(ML)模型在预测其组成中的主要变量,如水分和淀粉含量方面表现良好。因此,理化分析(NIRS)、高光谱数据(传感器)与机器学习(ML)的整合具有推动玉米籽粒分级现代化的潜力,并在采后质量评估中具有重要应用价值,可使行业快速、无损地监测和控制相关属性。
该文发表于《Food Analytical Methods》,聚焦于以新兴无损检测技术替代传统玉米物理分级的可行性问题。玉米是全球重要粮食、饲料及工业原料作物,其在食品、生物能源、制药和化工等领域的广泛利用,使得籽粒品质评价在整个生产链中具有重要意义,尤其是在采后分级环节。传统物理分级主要依赖外观目测标准,虽便于实施,但难以反映籽粒内部组成及理化特性,因此在真实性、全面性和效率方面均存在明显局限。这一现实问题推动研究人员尝试将近红外光谱(NIRS,近红外反射光谱分析)与高光谱传感技术结合,并进一步引入机器学习(ML,机器学习)模型,以建立更加快速、准确且无损的品质识别体系。
围绕这一目标,研究人员选取不同品种的完整玉米籽粒,区分为软质玉米和硬粒玉米两大组,并依据巴西农业主管部门颁布的商业分级标准,将样品进一步人工划分为I型、II型、III型和型外。研究核心并非仅比较外观分级差异,而是通过整合理化组成数据与高光谱反射数据,分析不同组别、不同商业分级之间的品质差异及其光谱响应规律,并借助多种机器学习模型实现对关键理化指标的预测。研究最终表明,传统分级能够在一定程度上反映淀粉等主要组成差异,但玉米品质实际上受到组别与分级交互作用的共同影响;同时,高光谱信息能够捕捉肉眼难以识别的结构与组成差异,特别是在水分和淀粉预测方面表现出较好潜力。由此,研究证明了无损光谱技术联合机器学习可为玉米采后质量评价和工业分级提供现代化替代路径,具有明确的方法学和应用意义。
在技术方法上,研究主要采用3类关键手段。其一,样本来自不同品种完整玉米籽粒,在Federal University of Santa Maria的采后实验室按官方标准分为软质玉米和硬粒玉米,并进一步分为I型、II型、III型和型外,每类制备2 kg样品并分装为100个20 g子样。其二,采用台式近红外反射光谱仪NIRS DS2500测定水分、粗蛋白、淀粉、脂质、粗纤维和灰分等理化指标。其三,采用FieldSpec 4 Jr高光谱辐射计获取350–2500 nm的Vis–NIR-SWIR光谱,并将光谱变量输入6种机器学习模型,通过分层10折交叉验证重复10次,以相关系数和平均绝对误差评价预测性能。
在研究结果部分,论文首先以“Proximate Composition”展示不同组别与分级下玉米籽粒基本理化组成的差异。结果表明,软质玉米与硬粒玉米组别同商业分级之间,在水分、淀粉、粗蛋白、脂质、粗纤维和灰分6项指标上均存在显著交互作用。这说明,玉米籽粒质量并不能由“软质/硬粒”或“I型/II型/III型/型外”中的单一因素解释,而必须从组别与分级共同作用的角度理解。水分含量在12.21%至13.06%之间变化,最低值出现在I型硬粒玉米,最高值出现在型外样品。淀粉含量方面,无论软质或硬粒组,I型均表现出最高水平,软质玉米为62.63%,硬粒玉米为63.84%,表明较高商业等级与较高淀粉含量相关。粗蛋白在软质玉米中为10.19%至10.46%,在硬粒玉米中为9.13%至9.61%,提示该指标与组别关联强于与商业分级的关联。脂质、粗纤维和灰分变化幅度较小,但整体上软质组略高于硬粒组,且数值与既有文献报道的玉米正常范围一致。该部分结果说明,商业分级虽主要基于外观缺陷,但仍在一定程度上映射出与淀粉相关的品质差异,而蛋白等成分则更多受籽粒类型本身影响。
随后,“Spectral Interpretation”部分从高光谱反射和吸收行为层面解释这些理化差异。研究人员利用350–2500 nm范围内的2152个光谱波段,分析不同组别与分级样品在水分、淀粉、粗蛋白、脂质、粗纤维和灰分上的光谱响应。结果显示,硬粒玉米与软质玉米在反射率变化范围和光谱离散程度上存在统计学差异。总体而言,两类玉米在可见光区约500–700 nm反射率较高,而在近红外区出现明显下降,并在特定波长处形成与理化组分对应的吸收峰。水分与反射率呈反向关系,含水量越高,特定波长处反射率越低;软质组中水分水平在各分级间相对稳定。淀粉作为玉米籽粒中的主要组分,其含量变化范围较窄,但仍可通过特征光谱区间表现出来。脂质在软质组中的光谱变化较为紧凑,而硬粒组尤其在III型中离散程度更大。粗纤维和灰分虽含量相对较低,但仍可在光谱中形成一定响应,尤其灰分较高时常对应更强的反射表现。
在吸收谱分析中,研究进一步总结出多个具有代表性的特征峰位,并将其与玉米籽粒中的主要化学键振动联系起来。约1000 nm区域与C–H伸缩振动协同作用相关,主要反映碳水化合物信息;约1200 nm区域与淀粉相关;1450–1455 nm及1925 nm分别对应水分中O–H键的典型吸收;1800 nm附近可见较弱的蛋白和脂质吸收;2175 nm区域与蛋白特征相关;2325 nm则主要归属于脂质。研究据此指出,尽管硬粒玉米与软质玉米的光谱外观高度相似,但这些细微而稳定的差异足以反映二者在胚乳结构和化学组成上的不同。硬粒玉米具有更明显的玻璃质基质,软质玉米则以粉质基质为主,这种物理结构差异会直接影响光与籽粒相互作用的方式,并最终表现为反射与吸收光谱的差别。因此,高光谱技术不仅能够感知化学组成,也能间接反映内部结构特征。
在“Machine Learning”部分,论文重点比较了6种机器学习模型在预测玉米理化属性方面的表现,包括ZEROR(ZR)、人工神经网络(ANN)、M5P模型树、随机森林(RF)、支持向量机(SVM)和REPTree(REPT)。模型输入变量为350–2500 nm范围内的高光谱反射率,输出变量为由NIRS获得的水分、淀粉、粗蛋白、脂质、粗纤维和灰分含量。通过分层10折交叉验证并重复10次,共进行100次运行,以相关系数r和平均绝对误差(MAE)评价模型性能。结果显示,这些模型在预测籽粒中含量较高的主要成分时效果较好,尤其是水分和淀粉。在硬粒玉米组中,SVM对水分和淀粉的预测表现最佳,分别达到r=0.54、MAE=0.43以及r=0.49、MAE=0.76,说明该模型能够较好捕捉光谱与主要理化属性之间的关系。相比之下,粗蛋白、脂质、粗纤维和灰分等含量较低或变化范围较小的指标,其相关性普遍偏低,r多在0至0.25之间。虽然这些变量的MAE仍然较低,但研究人员指出,这更多反映模型趋向样本均值预测,而非真正准确刻画变量离散程度,即存在均值偏倚现象。研究还发现,硬粒玉米总体上比软质玉米更容易获得较高相关性和较低误差,这进一步说明籽粒结构特征会影响高光谱数据的可解释性及模型预测效果。
综合全文,论文讨论部分强调,无损光谱技术在玉米品质评价中的优势,不仅体现在快速、非破坏、可同时读取多种信息,还体现在能够弥补传统外观分级无法识别内部组分差异的不足。研究表明,玉米品质的形成兼受商业分级和籽粒组别影响,且这种影响具有显著交互性。高光谱反射与吸收特征可稳定反映水分、淀粉、蛋白和脂质等主要成分及籽粒结构差异,为建立更精细的品质识别体系奠定基础。机器学习模型则为从复杂光谱中提取有效信息提供了计算框架,但不同变量的预测效果差异较大,说明未来若要提升低含量成分的预测精度,仍需在特征提取、模型优化和样本代表性方面继续完善。尽管如此,研究已清楚表明,将NIRS理化分析、高光谱传感与机器学习整合,可为玉米采后质量监测和工业分级提供切实可行的技术路线。
研究结论可概括如下:硬粒玉米与软质玉米籽粒的理化分析结果显示,组别与商业分级之间存在显著交互作用,说明品质并非由单一因素决定。水分与淀粉均在不同组别及分级中呈现差异化行为,其中无论组别如何,I型样品均具有较高淀粉含量。粗蛋白虽处于玉米典型范围内,但与组别的关联强于与分级的关联,脂质、粗纤维和灰分结果亦与玉米预期范围一致。反射与吸收光谱分析表明,尽管硬粒玉米与软质玉米的光谱外观相似,但其中存在可用于区分籽粒的细微变化;特征吸收峰证实了淀粉、粗蛋白和水分等组分的存在,验证了Vis–NIR-SWIR光谱技术对理化组成和结构差异的敏感性。在预测分析中,支持向量机(SVM)模型在属性预测方面表现有效。因此,理化分析(NIRS)、高光谱数据(传感器)与机器学习(ML)的整合,具有推动玉米籽粒分级现代化的潜力,并可用于采后质量快速、无损监测与控制。