Enhanced Grape Tracking with Extended Matching Algorithm for SORT and DeepSORT: A Novel Method for Yield Estimation in Vineyards

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computers and Electronics in Agriculture》：Enhanced grape tracking (using deep neural networks) with an extended matching algorithm for SORT and DeepSORT

【字体：大中小】 时间：2026年02月15日 来源：Computers and Electronics in Agriculture 8.9

编辑推荐：

　　为克服传统人工计数葡萄果串进行产量估算耗时耗力且易错，以及现有追踪方法依赖标注数据、难以应用于真实复杂葡萄园环境的挑战，本文评估了SORT、DeepSORT、ByteTrack等算法的实时追踪与计数性能，并提出融合马氏距离、IoU与欧氏距离新匹配策略的SORT+和DeepSORT+算法。结果表明，新算法显著提升了追踪精度与计数准确率，SORT+在无需额外训练数据的情况下，使计数准确率从33%提升至96%。这证明了利用无人机（UAV）在真实葡萄园中实现自动化、无损监测的可行性，为精准农业和可持续耕作提供了技术支撑。

葡萄是全球葡萄酒产业的经济支柱，年产值高达数千亿美元。然而，传统的葡萄产量估算方法依赖人工计数，不仅费时费力，还容易出错，难以满足现代化精细农业的需求。近年来，随着无人机技术的普及和计算机视觉的飞速发展，利用自动化视频分析进行葡萄果串追踪和计数，成为精准农业领域一个极具前景的研究方向。但这背后隐藏着一个核心难题：为了实现精准追踪，主流的算法往往需要一种名为“重识别网络”的技术，来区分不同果串。训练这个网络需要大量标注了“实例ID”（即每个果串独一无二的身份标签）的视频数据。然而，在农业场景中，获取如此精细的标注数据成本极高，费力不讨好，这成为了技术落地的一大瓶颈。那么，有没有一种方法，既能实现高精度的葡萄追踪与计数，又无需依赖这些昂贵的标注数据呢？

为了回答这一问题，一项发表在《Computers and Electronics in Agriculture》上的研究给出了创新的解决方案。来自卡尔斯鲁厄理工学院的研究团队系统性地评估了SORT、DeepSORT和ByteTrack等主流多目标追踪算法在葡萄计数任务上的表现，并创造性地提出了一种新颖的“扩展匹配级联”策略，由此衍生出两个改进版算法——SORT+和DeepSORT+。这项研究的目标很明确：在最具挑战性的真实葡萄园环境中，找到一种高效、准确且易于实现的自动化追踪与计数方法，为精确的产量估算和可持续农业实践提供技术支持。

为了开展这项研究，研究人员主要采用了几个关键技术方法。他们使用了Sentís等人于2021年发布的UAV RGB Video数据集，这是目前唯一公开包含葡萄簇实例ID注释的数据集，适合用于追踪性能评估。目标检测任务采用了Mask R-CNN（Region-Based Convolutional Neural Network） 模型，该模型能够同时输出目标的边界框和像素级掩码，便于后续分析果串面积。在追踪算法层面，研究不仅测试了经典的SORT（Simple Online and Realtime Tracking） 和DeepSORT（Deep Simple Online and Realtime Tracking） 算法，还引入了性能优异的ByteTrack作为对比基准。研究的核心创新在于为SORT和DeepSORT设计了扩展匹配级联策略，巧妙地将马氏距离、IoU重叠度和欧氏距离三种度量方式结合，以更鲁棒的方式在预测轨迹和当前检测结果之间进行匹配，从而提升追踪的准确性和稳定性。所有算法的实现、训练和评估均在OpenMMLab的MMTracking工具箱基础上进行修改和拓展。

研究结果通过严谨的评估，清晰地展示了各种算法的性能。

在追踪性能评估方面，研究使用了多目标追踪准确率（MOTA）、身份保持分数（IDF1）、身份切换次数（ID switches）等多个指标。结果表明，提出的扩展匹配级联为原始算法带来了显著提升。对于无需重识别网络的SORT算法，改进后的SORT+将MOTA和IDF1分数提升了5%至6%，同时将身份切换次数降低了惊人的62%。这使得免训练的SORT+性能足以媲美基于深度学习的DeepSORT。对于已经具备重识别能力的DeepSORT，改进后的DeepSORT+进一步将身份切换次数降低了12%。

在计数准确率评估方面，结果更具颠覆性。原始的SORT算法在葡萄簇计数任务上的准确率仅为33%，而采用新匹配策略的SORT+将这一数字大幅提升至96%。这一飞跃证明了，即使不依赖需要大量标注数据的深度重识别网络，仅通过优化匹配策略，也能在农业目标追踪任务上取得极佳的计数效果。

研究结论与讨论部分强调了本工作的三大贡献。首先，研究提出了针对SORT和DeepSORT的扩展匹配级联策略（即SORT+和DeepSORT+），有效融合了多种距离度量，提升了匹配的鲁棒性。其次，研究首次对五种追踪算法（SORT, DeepSORT, ByteTrack, SORT+, DeepSORT+）在葡萄追踪任务上进行了全面、公平的评估，并采用自助法（bootstrapping） 确保了统计可靠性。最后，研究验证了这些算法在葡萄产量估算方面的适用性，特别是SORT+在无需训练数据的情况下达到了96%的计数准确率。

这项研究的意义在于，它为解决农业计算机视觉中的标注数据瓶颈提供了一个高效、实用的方案。所提出的SORT+算法在几乎不增加计算成本的前提下，极大地提升了传统数学追踪器的性能，使其能够应用于缺乏标注数据的真实农业场景。这不仅推动了葡萄园自动化管理和产量预测技术的发展，也为其他类似农作物（如苹果、草莓等）的自动化监测提供了可借鉴的范例，为实现更智能、更可持续的农业生产模式奠定了基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号