基于改进蚁群算法与动态窗口法的果园移动机器人路径规划研究

【字体: 时间:2025年10月10日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  本文针对传统随机交叉验证在牲畜行为预测中因数据泄露导致结果虚高的问题,研究人员通过对比机器学习(ML)与深度学习(DL)模型在留出交叉验证(hold-out CV)和留牛交叉验证(leave-cow-out CV)下的性能,发现block CV设计能更真实评估模型泛化能力,MLP模型在预测新个体行为时表现突出,为精准畜牧业中的动物行为监测提供了重要方法学参考。

  
在精准畜牧业领域,准确监测牲畜行为对评估动物健康、福利和生产效率至关重要。传统人工观察方式不仅耗时耗力,还容易引入主观误差。随着可穿戴传感器技术的发展,三轴加速度计已成为监测牛群行为的有效工具,通过机器学习(ML)和深度学习(DL)算法对加速度数据进行分析,可以实现对牲畜行为的自动识别。然而,当前研究在评估模型性能时普遍采用随机交叉验证(random cross-validation, CV)方法,这种方法在划分训练集和测试集时,可能将同一头牛的数据同时放入两者,导致模型因数据泄露(data leakage)而产生过拟合,使预测结果过于乐观,无法真实反映模型在新个体上的泛化能力。此外,尽管机器学习模型已被广泛应用,深度学习模型在牲畜行为预测中的潜力尚未充分探索,尤其是在考虑数据固有结构(如个体差异)时的性能表现如何,仍有待深入研究。
为应对这些挑战,Jin Wang等研究人员在《Smart Agricultural Technology》上发表了一项研究,系统评估了不同交叉验证设计对多类别不平衡牛群行为预测的影响,并比较了机器学习与深度学习模型的性能。该研究利用公开的三轴加速度计数据集,包含六头肉牛超过197分钟的22,987条记录,聚焦于站立休息(RES)、站立反刍(RUS)、移动(MOV)和采食(GRZ)四种主要行为。研究人员采用了五种不同比例的留出交叉验证(hold-out CV)和三种留牛交叉验证(leave-cow-out CV, LCO CV)设计,分别代表随机CV和区块CV(block CV)。在模型方面,研究选择了三种机器学习模型(K近邻KNN、随机森林RF、梯度提升GB)和两种深度学习模型(多层感知机MLP、卷积神经网络CNN),通过准确率、宏精确度、宏召回率和宏F1分数等指标全面评估模型性能。
研究采用的关键技术方法主要包括:从原始三轴加速度数据中提取幅度、俯仰角、滚转角和信号幅度面积等特征,并使用滑动窗口法(窗口大小1秒,步长0.5秒)进行下采样,生成28个统计特征;通过相关性分析剔除高度相关特征,最终保留20个特征用于模型构建;使用网格搜索和5折交叉验证进行超参数优化;采用TensorFlow和scikit-learn平台实现深度学习与机器学习模型。
研究结果部分显示:
在留出交叉验证设计中,所有模型都表现出较高的性能,机器学习模型的准确率在0.94-0.95之间,F1分数在0.93-0.94之间,略优于深度学习模型(准确率0.90-0.92,F1分数0.89-0.91)。随着训练集比例的减少,模型性能仅有轻微下降,表明在数据随机划分的情况下,各模型都能获得较好的预测效果。
在留牛交叉验证设计中,模型性能显著降低,准确率范围降至0.72-0.82,F1分数降至0.64-0.76。在留一牛出(L1CO)验证中,随机森林表现最佳(准确率0.82,F1分数0.76);在留二牛出(L2CO)验证中,梯度提升模型领先(准确率0.80,F1分数0.73);而在留三牛出(L3CO)验证中,多层感知机MLP表现出最佳性能(准确率0.82,F1分数0.76)。特别值得注意的是,在留牛交叉验证设置下,深度学习模型(尤其是MLP)表现出与机器学习模型相当甚至更优的性能,特别是在测试集中包含更多未见过的牛只时。
行为特异性分析表明,在留出交叉验证中,所有行为都获得了较高的F1分数(0.87-0.96),而在留牛交叉验证中, ruminating while standing (RUS)行为的预测性能显著较低(F1分数约0.49-0.51),表明该行为可能具有更强的个体特异性,模型难以推广到新个体。
研究结论与讨论部分强调,交叉验证设计对牲畜行为预测性能有显著影响。随机交叉验证(留出CV)由于可能包含相同个体的数据在训练集和测试集中,会产生过于乐观的预测结果,这种性能提升是人为虚高的。而区块交叉验证(留牛CV)通过策略性地按个体划分数据,能更好地评估模型在未见个体上的泛化能力,提供更真实、更保守的性能估计。虽然机器学习模型在随机交叉验证中表现略优,但深度学习模型(特别是MLP)在区块交叉验证中展现出竞争性甚至更优的性能,表明其可能更适合处理个体间变异,推广到新个体的能力更强。
这项研究的方法学启示对精准畜牧业具有重要意义:首先,它强调了在评估动物行为预测模型时,需要考虑数据的固有结构(如个体差异),避免使用可能引入数据泄露的随机交叉验证方法;其次,研究发现深度学习模型在应对个体间变异方面具有潜力,为未来开发更稳健的行为监测系统提供了方向;最后,研究结果为农场管理决策提供了更可靠的评估框架,有助于开发真正实用的精准畜牧业解决方案。未来的研究可以扩大样本规模,探索更多样的行为类别,并进一步优化特征提取和模型设计,以提高对牲畜行为的自动识别能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号