利用集成高光谱和纹理特征的机器学习模型来估算与水稻产量相关的性状
《Frontiers in Plant Science》:Estimating rice yield-related traits using machine learning models integrating hyperspectral and texture features
【字体:
大
中
小
】
时间:2025年11月08日
来源:Frontiers in Plant Science 4.8
编辑推荐:
水稻产量相关指标(LNC、LAI、AGB、GY)的高精度估算模型研究。采用无人机搭载高光谱相机采集数据,结合SPA、CARS、PCC三种降维方法,筛选敏感波段,并利用ANN、SVR、1DCNN、LSTM等机器学习算法构建模型。结果表明SPA-ANN模型最佳,LNC和LAI的R2分别为0.82和0.75,引入纹理特征后LNC的R2提升9.9%,RMSE降低27.2%。CARS-ANN模型在AGB和GY估算中表现最优,R2达0.90和0.63。该研究为水稻精准诊断提供技术支撑。
在现代农业科技迅猛发展的背景下,精准诊断作物的多种性状指标成为提升农业生产效率与保障粮食安全的重要手段。水稻作为中国的主要粮食作物之一,其生长性状的准确监测和预测对于实现健康生长和精准施肥管理具有关键意义。本文围绕水稻的叶氮浓度(LNC)、叶面积指数(LAI)、地上生物量(AGB)和产量(GY)等关键指标,探讨了如何通过“光谱数据+纹理数据+降维+机器学习”这一综合策略,构建高精度的估计模型。这一方法不仅能够实现对作物性状的非破坏性评估,还能够提高模型的准确性和稳定性,从而为水稻的精准农业管理提供科学依据和技术支持。
水稻的生长性状指标与光谱数据之间存在密切的联系。光谱数据能够反映作物的生物化学特性,而纹理特征则包含了作物的空间结构和形态信息。通过将这两种数据结合起来,可以更全面地描述作物的生长状态,提高模型的预测能力。在本研究中,采用了多种数据降维技术,包括皮尔逊相关系数法(PCC)、逐步投影算法(SPA)和竞争自适应重加权采样法(CARS),以筛选出对目标性状具有显著影响的敏感波段。随后,利用人工神经网络(ANN)、支持向量机回归(SVR)、一维卷积神经网络(1DCNN)和长短期记忆网络(LSTM)等机器学习算法,构建了相应的估计模型。结果表明,SPA-ANN模型在预测LNC和LAI方面表现最佳,而CARS-ANN模型则在预测AGB和GY方面具有更高的精度。
实验过程中,研究人员采用了多旋翼无人机M300 RTK,并搭配X20P航空光谱成像设备,对水稻冠层的光谱数据进行了采集。采集时间涵盖了2022年至2023年水稻生长的四个关键阶段,以确保数据的全面性和代表性。采集到的光谱数据经过一系列预处理,包括图像拼接、辐射校正、大气校正、正射校正、图像融合和波段归一化等步骤,以提高数据的可靠性和模型的准确性。此外,为了消除环境因素带来的噪声波段,研究人员还应用了Savitzky–Golay卷积平滑算法对原始光谱数据进行处理。该算法通过多项式最小二乘拟合,有效降低了噪声干扰,同时保留了原始光谱信息的完整性。
在模型构建过程中,研究人员对四种不同的性状指标进行了系统分析,并探讨了不同降维方法和机器学习算法对模型性能的影响。实验结果表明,不同的降维方法在不同性状指标的预测中表现出不同的优势。例如,当使用SPA进行波段筛选时,其在预测LNC和LAI方面的表现优于PCC和CARS方法。这是因为SPA算法通过逐步选择对模型贡献最大的波段,能够有效减少变量间的共线性问题,同时保留重要的信息。相比之下,CARS算法在预测AGB和GY方面更具优势,因为它能够模拟达尔文的“适者生存”理念,通过适应性加权采样技术选择对目标变量影响较大的波段,并结合交叉验证选择最优的波段组合。
在机器学习算法的选择上,实验发现ANN模型在预测LNC、LAI、AGB和GY方面均表现出较高的精度和稳定性。这主要得益于ANN的非线性特性,使其能够捕捉复杂的输入与输出之间的关系。与ANN相比,SVR、1DCNN和LSTM等算法在处理非线性数据时表现较为有限。尽管SVR具有较强的抗噪能力,但其对参数的依赖性较高,容易影响模型的性能。1DCNN虽然在图像和语音数据处理方面表现出色,但其参数调整较为繁琐,且模型的可解释性较低。而LSTM虽然适用于处理长序列数据,但在计算复杂性和并行化能力方面存在不足,导致其在水稻性状估计中的表现不如ANN。
在引入纹理特征后,模型的预测能力得到了显著提升。对于LNC,加入纹理特征后,模型的R2值提高了9.9%,而RMSE降低了27.2%。纹理特征能够提供额外的空间信息,有助于捕捉作物的微观结构和模式,从而弥补单一光谱数据在描述作物性状方面的不足。然而,对于LAI、AGB和GY等指标,加入纹理特征后的提升幅度相对较小。这可能是因为这些指标的预测模型已经通过最优的降维方法和机器学习算法实现了较高的精度,因此进一步优化的空间有限。此外,AGB的估计模型在所有指标中表现最为突出,这与AGB较大的情况下光谱反射率较低、敏感波段选择更加明确有关。
研究还发现,不同性状指标之间的相关性存在显著差异。例如,AGB与GY之间的相关性最强,R2值达到0.60以上;而LAI与AGB之间的相关性也较高,R2值达到0.75以上。这些相关性表明,AGB和LAI在一定程度上能够反映水稻的生长状况,进而影响产量。因此,在构建估计模型时,需要综合考虑这些指标之间的相互作用,以提高模型的整体性能。
本研究通过系统分析光谱数据和纹理特征的结合对水稻性状预测的影响,揭示了不同降维方法和机器学习算法在不同性状指标预测中的适用性。结果表明,SPA-ANN模型在预测LNC和LAI方面具有最佳性能,而CARS-ANN模型在预测AGB和GY方面表现更优。这说明,在选择降维方法和机器学习算法时,应根据具体的性状指标进行调整,以实现最佳的预测效果。此外,加入纹理特征后,模型的精度和稳定性均有所提升,表明光谱与纹理数据的融合能够有效增强模型的预测能力。
综上所述,本研究为水稻性状的非破坏性实时预测和精准诊断提供了科学依据和技术支持。通过“光谱数据+纹理数据+降维+机器学习”这一综合策略,不仅提高了模型的预测精度,还增强了模型的稳定性和适用性。未来,随着技术的进一步发展,可以借鉴本研究中的方法,构建更加精确和高效的作物性状估计模型,从而为精准农业管理提供更强大的技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号