Enhanced Grape Tracking with Extended Matching Algorithm for SORT and DeepSORT: A Novel Method for Yield Estimation in Vineyards
《Computers and Electronics in Agriculture》:Enhanced grape tracking (using deep neural networks) with an extended matching algorithm for SORT and DeepSORT
编辑推荐:
为克服传统人工计数葡萄果串进行产量估算耗时耗力且易错,以及现有追踪方法依赖标注数据、难以应用于真实复杂葡萄园环境的挑战,本文评估了SORT、DeepSORT、ByteTrack等算法的实时追踪与计数性能,并提出融合马氏距离、IoU与欧氏距离新匹配策略的SORT+和DeepSORT+算法。结果表明,新算法显著提升了追踪精度与计数准确率,SORT+在无需额外训练数据的情况下,使计数准确率从33%提升至96%。这证明了利用无人机(UAV)在真实葡萄园中实现自动化、无损监测的可行性,为精准农业和可持续耕作提供了技术支撑。
葡萄是全球葡萄酒产业的经济支柱,年产值高达数千亿美元。然而,传统的葡萄产量估算方法依赖人工计数,不仅费时费力,还容易出错,难以满足现代化精细农业的需求。近年来,随着无人机技术的普及和计算机视觉的飞速发展,利用自动化视频分析进行葡萄果串追踪和计数,成为精准农业领域一个极具前景的研究方向。但这背后隐藏着一个核心难题:为了实现精准追踪,主流的算法往往需要一种名为“重识别网络”的技术,来区分不同果串。训练这个网络需要大量标注了“实例ID”(即每个果串独一无二的身份标签)的视频数据。然而,在农业场景中,获取如此精细的标注数据成本极高,费力不讨好,这成为了技术落地的一大瓶颈。那么,有没有一种方法,既能实现高精度的葡萄追踪与计数,又无需依赖这些昂贵的标注数据呢?
为了回答这一问题,一项发表在《Computers and Electronics in Agriculture》上的研究给出了创新的解决方案。来自卡尔斯鲁厄理工学院的研究团队系统性地评估了SORT、DeepSORT和ByteTrack等主流多目标追踪算法在葡萄计数任务上的表现,并创造性地提出了一种新颖的“扩展匹配级联”策略,由此衍生出两个改进版算法——SORT+和DeepSORT+。这项研究的目标很明确:在最具挑战性的真实葡萄园环境中,找到一种高效、准确且易于实现的自动化追踪与计数方法,为精确的产量估算和可持续农业实践提供技术支持。
为了开展这项研究,研究人员主要采用了几个关键技术方法。他们使用了Sentís等人于2021年发布的UAV RGB Video数据集,这是目前唯一公开包含葡萄簇实例ID注释的数据集,适合用于追踪性能评估。目标检测任务采用了Mask R-CNN(Region-Based Convolutional Neural Network) 模型,该模型能够同时输出目标的边界框和像素级掩码,便于后续分析果串面积。在追踪算法层面,研究不仅测试了经典的SORT(Simple Online and Realtime Tracking) 和DeepSORT(Deep Simple Online and Realtime Tracking) 算法,还引入了性能优异的ByteTrack作为对比基准。研究的核心创新在于为SORT和DeepSORT设计了扩展匹配级联策略,巧妙地将马氏距离、IoU重叠度和欧氏距离三种度量方式结合,以更鲁棒的方式在预测轨迹和当前检测结果之间进行匹配,从而提升追踪的准确性和稳定性。所有算法的实现、训练和评估均在OpenMMLab的MMTracking工具箱基础上进行修改和拓展。
研究结果通过严谨的评估,清晰地展示了各种算法的性能。
在追踪性能评估方面,研究使用了多目标追踪准确率(MOTA)、身份保持分数(IDF1)、身份切换次数(ID switches)等多个指标。结果表明,提出的扩展匹配级联为原始算法带来了显著提升。对于无需重识别网络的SORT算法,改进后的SORT+将MOTA和IDF1分数提升了5%至6%,同时将身份切换次数降低了惊人的62%。这使得免训练的SORT+性能足以媲美基于深度学习的DeepSORT。对于已经具备重识别能力的DeepSORT,改进后的DeepSORT+进一步将身份切换次数降低了12%。
在计数准确率评估方面,结果更具颠覆性。原始的SORT算法在葡萄簇计数任务上的准确率仅为33%,而采用新匹配策略的SORT+将这一数字大幅提升至96%。这一飞跃证明了,即使不依赖需要大量标注数据的深度重识别网络,仅通过优化匹配策略,也能在农业目标追踪任务上取得极佳的计数效果。
研究结论与讨论部分强调了本工作的三大贡献。首先,研究提出了针对SORT和DeepSORT的扩展匹配级联策略(即SORT+和DeepSORT+),有效融合了多种距离度量,提升了匹配的鲁棒性。其次,研究首次对五种追踪算法(SORT, DeepSORT, ByteTrack, SORT+, DeepSORT+)在葡萄追踪任务上进行了全面、公平的评估,并采用自助法(bootstrapping) 确保了统计可靠性。最后,研究验证了这些算法在葡萄产量估算方面的适用性,特别是SORT+在无需训练数据的情况下达到了96%的计数准确率。
这项研究的意义在于,它为解决农业计算机视觉中的标注数据瓶颈提供了一个高效、实用的方案。所提出的SORT+算法在几乎不增加计算成本的前提下,极大地提升了传统数学追踪器的性能,使其能够应用于缺乏标注数据的真实农业场景。这不仅推动了葡萄园自动化管理和产量预测技术的发展,也为其他类似农作物(如苹果、草莓等)的自动化监测提供了可借鉴的范例,为实现更智能、更可持续的农业生产模式奠定了基础。