编辑推荐:
为解决牛油果品种鉴别难题,研究人员开展基于光谱技术区分不同牛油果品种的研究。通过对果实和叶片光谱数据的分析,发现特定波长可有效分类品种,且多种模型准确率较高。这对牛油果种植意义重大。
在水果的世界里,牛油果凭借其独特的风味和丰富的营养,成为了人们餐桌上的宠儿。从墨西哥的古老果园,到遍布全球的种植园,牛油果的身影越来越常见。然而,对于牛油果的种植者和研究者来说,一个棘手的问题一直存在 —— 如何准确区分不同的牛油果品种?
牛油果的遗传异质性高,这使得其后代极具变异性和不可预测性。在育种过程中,获取识别和区分品种所需的分子资源及表型数据变得异常困难。以往依靠果实、叶片和树的形态、颜色、质地等物理特征来区分品种的方法并不总是准确,尤其是对于杂交品种或外观相似的种类。虽然 DNA 分析技术可以准确鉴别牛油果品种,但该方法较为复杂。因此,寻找一种高效、准确的牛油果品种鉴别方法迫在眉睫。
为了解决这一难题,来自国外的研究人员开展了一项具有重要意义的研究。他们以六种不同的牛油果品种(Reed、Hass、Fuerte、Pinkerton、Horshim 和 Lambhass)为研究对象,利用野外光谱技术,在 949.041 - 2505.06nm 的光谱范围内,对牛油果的果实和叶片进行了深入研究。研究成果发表在《Computational and Structural Biotechnology Reports》上。
在这项研究中,研究人员采用了多种关键技术方法。首先,他们从黎巴嫩沿海的多个地点(Marwniyeh、Abbaseyeh、Ansar、Nmereyeh)手动采集了七个品种的牛油果果实和叶片样本。接着,使用 HySpex SWIR - 384 高光谱相机获取样本图像,并通过一系列软件进行校准和数据处理,得到光谱数据。然后,运用偏最小二乘法判别分析(PLS - DA)、K 近邻(KNN)、支持向量机(SVM)、多项逻辑回归(MLR)和决策树等多种分类模型对光谱数据进行分析。同时,利用随机森林(RF)和逐步分析等变量选择技术,找出对分类有重要影响的波长。
下面来看看具体的研究结果:
- 果实数据:研究发现,不同品种牛油果果实的反射率在光谱范围内存在显著差异,如在 1203.86 - 1301.45nm 和 1702.65 - 1903.25nm 处有反射率谷。通过 RF 和逐步分析确定了 57 个对分类重要的波长。在众多分类模型中,基于 RF 的逻辑回归模型表现最佳,预测准确率高达 86.68%,AUC - ROC 值为 0.991,能有效区分不同品种的牛油果果实。
- 叶片数据:不同品种牛油果叶片的反射率在 1605.06 - 1879.83nm 范围内也存在差异。经变量选择确定了 55 个重要波长。同样,基于 RF 的逻辑回归模型表现出色,准确率为 75.05% ,AUC 为 0.908,但在区分某些品种(如 Hass 和 Fuerte)时存在一定的误判情况。
- 叶片和果实数据结合:将叶片和果实数据合并分析时,采用随机森林变量选择的 KNN 模型(K = 6)表现最佳,准确率达到 80.26%,整体精度为 79.58%。这表明结合两种数据并运用合适的模型和变量选择方法,能更准确地对牛油果品种进行分类。
研究结论和讨论部分指出,野外光谱技术在区分不同牛油果品种方面具有显著的有效性。基于随机森林变量选择的分类模型,无论是对果实数据、叶片数据还是两者结合的数据,都能实现较高准确率的分类。这一研究成果对于牛油果的品种鉴定、质量控制以及农业生产实践具有重要意义。它为种植者提供了一种可靠的品种鉴别方法,有助于优化种植策略,提高牛油果的产量和质量。同时,也为相关研究人员在牛油果品种研究领域提供了新的思路和方法,推动了牛油果种植产业的发展。