基于数据驱动的机器学习模型优化玉米产量预测:一种融合ANN-KNN的混合算法研究

【字体: 时间:2025年08月09日 来源:Franklin Open CS1.4

编辑推荐:

  为解决撒哈拉以南非洲地区玉米产量预测精度不足的问题,尼日利亚Wellspring University的研究团队整合土壤参数、大气数据和玉米植株物理特征,构建了包含63,243条数据的多源数据集。通过比较NB、SVM、KNN、DT、ANN及创新的ANN-KNN混合模型,发现ANN-KNN以99.45%的准确率显著优于传统方法(ANN为98.83%),为精准农业决策提供了可靠的技术支撑。该成果发表于《Franklin Open》,对实现联合国"零饥饿"可持续发展目标具有重要实践价值。

  

在全球人口持续增长与粮食安全挑战加剧的背景下,撒哈拉以南非洲地区面临严峻的农业生产压力。作为该地区主要粮食作物的玉米(Zea mays L.),其产量波动直接影响2.5%年增长率人口的生存需求。然而,传统农业技术难以应对气候变化和资源限制的双重挑战,尤其缺乏整合多维度环境参数的智能预测系统。现有研究多依赖卫星遥感或模拟数据,往往忽略关键的植物生理指标,导致预测模型在实地应用时存在显著偏差。

尼日利亚贝宁城Wellspring University计算系的研究团队Tosin Comfort Olayinka等人通过为期75天的田间实验,创新性地将物联网(IoT)传感器采集的38维特征(涵盖土壤氮磷钾含量、温湿度等理化指标,大气温压数据,以及植株高度、茎粗、叶面积等27项生长参数)与OpenWeather API气象数据融合,建立了首个包含63,243条样本的非洲本土化玉米生长数据库。研究采用Boruta算法筛选出31个关键特征,通过Min-Max归一化预处理后,系统比较了六种机器学习模型的性能。

关键技术包括:(1)基于RCBD(随机完全区组设计)的田间数据采集方案;(2)融合IoT传感网络与开放API的多源数据整合;(3)采用Boruta特征选择算法;(4)构建包含8-4-3结构的ANN模型(ReLU-Softmax激活);(5)创新性设计ANN特征提取与KNN分类结合的混合架构。

研究结果显示:

  1. 环境参数关联性:温度升高导致产量下降(土壤温度>30°C时高产概率降低62%),而湿度与氮含量呈正相关(r=0.82)。

  2. 模型性能比较:传统算法中DT表现最佳(96.04%),但ANN通过深度特征学习将准确率提升至98.83%。突破性进展来自ANN-KNN混合模型,其F1-score在低、中、高产三类均达0.99以上。

  3. 关键影响因素:叶面积(Leaf_Area)与产量相关性最高(R2=0.91),其次为吐丝期(Silking)天数。

该研究首次证实了融合植物表型组数据可显著提升热带地区作物预测精度。ANN-KNN模型通过结合ANN的非线性特征提取能力和KNN的局部模式识别优势,在应对土壤异质性方面展现出独特价值。研究团队公开了完整数据集,为后续智慧农业研究提供了重要基准。这项发表于《Franklin Open》的成果,不仅为小农户提供了种植决策支持工具,更通过可解释的机器学习框架(如决策树可视化),帮助农艺师理解环境-基因型-产量的复杂互作关系,对实现SDG2零饥饿目标具有现实意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号