基于机器学习算法的豆科植物大量元素含量精准预测模型研究及其在精准农业中的应用

【字体: 时间:2025年10月07日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对传统实验室分析豆科植物大量元素(P、K、Ca、Mg)耗时费力的问题,开发了四种机器学习模型(MARS、KNN、SVR、ANN),利用饲料品质参数(ADF、NDF等)进行快速预测。结果表明MARS模型预测性能最优(RMSE最低,R2最高),为精准农业中的饲料营养价值评估提供了高效可靠的新方法。

  
豆科植物作为动物饲养中重要的粗饲料来源,其营养价值直接影响牲畜的健康和生产性能。特别是磷(P)、钾(K)、钙(Ca)、镁(Mg)等大量元素,在动物骨骼发育、繁殖性能和生理功能调节中发挥着关键作用。传统上,这些元素的含量测定需要依赖实验室化学分析,过程繁琐、耗时且成本较高。因此,开发快速、准确且非破坏性的预测方法对于实现精准饲粮配比和可持续农业发展具有重要意义。
近期发表在《Scientific Reports》上的一项研究,针对这一需求开展了创新性探索。该研究团队利用机器学习技术,对土耳其里泽省Camlihemsin地区自然生长的10种豆科植物的大量元素含量进行预测建模,为牧场管理和饲料优化提供了新思路。
研究人员主要采用了四种经典的机器学习算法:多元自适应回归样条(MARS)、K近邻(KNN)、支持向量回归(SVR)和人工神经网络(ANN)。所有模型均基于来自30个植物样本的饲料品质参数(包括干物质比率(DM)、粗蛋白(CP)、酸性洗涤纤维(ADF)、中性洗涤纤维(NDF)等)进行训练和测试。数据按70%训练集和30%测试集划分,并通过10折交叉验证进行超参数调优,使用均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)等指标评估模型性能。

描述性统计与相关性分析

对两年期(2019和2020)豆科植物样本的营养指标分析显示,各质量性状存在较大变异。干物质比率平均为85.23%,粗蛋白含量在16.16%–23.39%之间,纤维组分ADF和NDF分别平均为40.45%和52.52%。矿物质中,磷、钾、钙、镁的平均含量分别为0.41%、1.64%、1.67%和0.42%。相关性分析揭示了一些显著关系,例如ADF与可消化干物质(DDM)、消化能(DE)和代谢能(ME)呈完全负相关(r = -1.0),而钾含量与钾钙镁比[K/(Ca+Mg)]呈强正相关(r = 0.9606),表明这些参数之间存在密切的相互影响。

主成分分析(PCA)

主成分分析结果显示,前三个主成分累计解释了总方差的89.858%。PC1(40.700%的方差)与DDM、DMI、RFV、DE和ME正相关,与ADF和NDF负相关;PC2(34.350%)与Ca、Mg和Ca/P正相关,与K和K/(Ca+Mg)负相关;PC3(14.808%)与CP、ADP和P正相关,与DM负相关。这表明不同品质指标对整体变异的贡献程度不同,且物种间存在明显的品质特性差异。

预测模型结果

多元自适应回归样条(MARS)

MARS模型在预测所有大量元素时均表现最佳。其通过后向选择程序确定最优参数(nprune=7,交互程度=1),并识别出K/(Ca+Mg)比率是最重要的预测因子。该模型在测试集上对P、K、Ca、Mg的预测R2值分别为0.0747、0.782、0.745和0.432,RMSE分别为0.107、0.059、0.018和0.009,显示出较高的准确性和稳定性。模型方程揭示了当K/(Ca+Mg)超过阈值0.8505155时,P和K的预测值趋于下降,而Ca和Mg的预测值趋于上升的非线性关系。

K近邻(KNN)

KNN模型经过调优后选择k=2,但其整体预测性能较差,所有元素的R2值均接近0.0025,RMSE较高(P:0.648;K:0.320;Ca:0.120;Mg:0.080)。结果表明该模型难以捕捉数据中的复杂模式。

支持向量回归(SVR)和人工神经网络(ANN)

SVR(使用RBF核,sigma=0.01, C=10)和ANN(两层隐藏层结构,5和3个神经元)的表现均不理想。SVR的R2值仅为0.0025,RMSE较高(P:0.791;Mg:0.15)。ANN的预测误差最大(P的RMSE为1.436),R2为0.03,且出现轻微过拟合现象。其权重分布图显示了输入变量与隐藏层神经元之间的复杂连接,但未能有效提升预测性能。

模型比较与讨论

综合比较显示,MARS模型在预测准确性和稳定性方面显著优于其他模型,这归因于其处理非线性关系和交互效应的能力。KNN表现尚可但不够精确,而SVR和ANN则因数据集较小和对超参数敏感而表现不佳。研究还指出,尽管集成方法如随机森林或梯度提升可能具有潜力,但选择MARS等可解释性强的模型对于农业应用更为合适。
研究的实际意义在于为农民和研究人员提供了一种快速评估豆科植物营养价值的工具,有助于优化饲料配比和养分管理。然而,样本量较小(n=30)限制了模型的泛化能力,未来需要更大规模的数据集来验证和扩展这些发现。
该研究通过比较多种机器学习算法,成功建立了预测豆科植物大量元素含量的高效模型,其中MARS表现最为突出。这不仅为精准农业提供了可靠的技术支持,也为后续研究指明了方向——扩大数据集、整合土壤参数以及探索更先进的机器学习方法,将进一步提升预测模型的准确性和实用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号