多动物追踪技术转型:传统方法与新兴方法的比较洞察
《Smart Agricultural Technology》:Multi-Animal Tracking in Transition: Comparative Insights into Established and Emerging Methods
【字体:
大
中
小
】
时间:2025年10月19日
来源:Smart Agricultural Technology 5.7
编辑推荐:
本研究针对精准畜牧业中动物长期行为监测的挑战,系统比较了多动物追踪(MAT)与多目标追踪(MOT)方法在猪只长期跟踪中的性能。研究人员通过10分钟猪群视频数据集,评估了DeepLabCut、idTracker等MAT工具与ByteTrack、DeepSORT等MOT方法的追踪效果。结果表明,MOT方法整体优于传统MAT工具,特别是基于基础模型的Track-Anything和PromptTrack等无监督方法展现出接近监督方法的性能,为自动化牲畜追踪提供了更准确可靠的解决方案。
在现代化畜牧业发展中,精准 livestock farming 已成为行业转型升级的关键方向。随着养殖规模不断扩大,如何实时监测动物的健康状况和行为表现,成为提高动物福利和生产效率的核心难题。传统的人工观察方式不仅耗时耗力,而且难以实现24小时不间断监控,更无法对海量行为数据进行量化分析。
正是在这样的背景下,计算机视觉技术为畜牧业带来了革命性的解决方案。通过视频监控系统,研究人员可以非侵入式地采集动物行为数据,并利用多动物追踪(Multi-Animal Tracking, MAT)技术对群体中的每个个体进行长期跟踪。这项技术不仅能够记录动物的运动轨迹,还能分析其社交行为、采食规律等重要指标,为疾病早期预警和饲养管理优化提供数据支持。
然而,MAT技术在实际应用中面临着诸多挑战。动物群体中频繁发生的遮挡现象、个体间高度相似的外观特征、不规则的运动模式以及多样化的行为类型,都给准确追踪带来了巨大困难。更令人担忧的是,目前畜牧业领域广泛使用的一些MAT工具,其性能往往落后于计算机视觉领域的主流多目标追踪(Multi-Object Tracking, MOT)方法,这直接影响了后续行为分析和健康状态评估的准确性。
为了厘清不同追踪方法的实际效果,来自拉瓦尔大学的研究团队开展了一项系统性比较研究。他们在《Smart Agricultural Technology》上发表的论文《Multi-Animal Tracking in Transition: Comparative Insights into Established and Emerging Methods》,对传统MAT工具和现代MOT方法进行了全面评估,旨在为畜牧业研究者提供科学的选择依据。
研究人员采用的关键技术方法包括:使用10分钟猪群互动视频作为实验数据集,该数据集包含15头生长育肥猪在圈舍内的活动情况,以25帧/秒的速率拍摄,共有15,000帧图像,其中782帧进行了详细标注,包括每头猪的五个关键点(耳朵、鼻子、颈部、尾巴)和个体身份信息;利用YOLOX模型进行监督式检测训练,使用80%的数据进行训练,20%用于验证,经过500个训练周期后,在验证集上达到95%的mAP(平均精度均值);采用IDF1(身份感知F1分数)和MOTA(多目标跟踪准确度)等标准指标评估跟踪性能,同时计算识别准确率、召回率和F1分数来全面评估各方法的身份保持能力;比较的方法涵盖有监督检测方法(DeepLabCut、ByteTrack、DeepSORT、Cross-Input Consistency)和无监督检测方法(idTracker、Track-Anything、PromptTrack),确保覆盖不同技术路线。
研究发现,在基于监督检测的方法中,DeepLabCut的性能高度依赖于使用的关键点数量。当使用5个关键点(鼻子、双耳、颈部、尾巴)时,其检测F1分数达到0.98,显著优于使用2个或3个关键点的配置。然而,即使在使用5个关键点的最优情况下,DeepLabCut的跟踪性能仍然低于大多数监督式MOT方法。
进一步分析显示,DeepLabCut存在关键点误分配问题。当某个动物的关键点检测缺失时,系统可能会从邻近猪只"借用"关键点来构建骨架,导致身份混淆。数据显示,约有0.82%的猪只至少有一个关键点被误分配,平均每9帧就会出现一次关键点误分配情况。这种错误直接造成了频繁的身份切换,影响了跟踪的连续性。
在监督式MOT方法中,ByteTrack表现出最稳定的性能。该方法通过保留低置信度检测结果,并在高置信度对象匹配后再进行匹配的策略,有效减少了因短暂遮挡导致的跟踪丢失。与DeepSORT相比,ByteTrack在长期跟踪场景中展现出了轻微但持续的优势。Cross-Input Consistency方法则由于身份切换次数较多,整体性能相对较低。
所有监督式方法都面临一个共同挑战:随着跟踪时间的延长,身份一致性逐渐下降。一旦发生身份切换,这些方法缺乏有效的纠正机制,错误会持续累积,导致跟踪性能随时间推移而降低。
在无监督检测方法中,Track-Anything和PromptTrack的表现令人惊喜。这两种基于基础模型的方法无需预训练检测模型,却达到了与ByteTrack相当的跟踪性能。
具体而言,Track-Anything利用Segment Anything Model (SAM)进行分割级检测,结合XMem实现时序一致性跟踪,其检测F1分数达到0.95,召回率为0.92。PromptTrack则采用OWLv2进行基于文本提示的检测,配合ByteTrack进行跟踪,检测F1分数为0.96,召回率为0.94。这两种方法都显著超越了传统无监督方法idTracker(检测F1分数仅为0.86)。
值得注意的是,Track-Anything需要用户在视频第一帧手动点击标记每个动物,而PromptTrack仅需文本提示即可完成初始化,后者在处理多个视频时具有更好的可扩展性。虽然这些新兴工具目前缺乏传统MAT软件那样完善的图形用户界面,但其安装和使用相对简便,且有着活跃的开源社区支持。
将本研究结果与已有文献对比发现,Su等人之前在黑牛跟踪中的研究也观察到类似现象:现代MOT方法在短期跟踪中表现优异,但在遮挡和密集群体情况下身份一致性会下降。Panadeiro等人对28种开源动物跟踪工具的综述指出,传统MAT软件在拥挤场景和长期跟踪中稳健性不足,本研究结果进一步证实了这一结论。
Wurtz等人专门在猪只跟踪中测试发现,传统MAT工具在商业农场条件下的可靠性有限,跟踪准确率很少超过85%左右。本研究中idTracker的低性能与此一致,但新兴的基于提示和分割的方法(PromptTrack和Track-Anything)将检测性能提升至F1≥0.95,跟踪精度接近监督式MOT方法。
AnimalTrack基准测试强调,将标准MOT流程应用于野生动物序列会导致性能显著下降,特别是在长期身份保持方面。本研究支持这一观察,同时证明基于基础模型的无监督方法能够减轻这一问题,在没有预训练的情况下达到接近ByteTrack的准确度。
研究结论表明,MOT方法在跟踪性能上 consistently 优于MAT方法,特别是在长期跟踪场景中。监督式方法虽然检测精度高,但面临身份切换累积的问题;而无监督方法如Track-Anything和PromptTrack凭借基础模型的优势,实现了与监督方法相媲美的性能,且无需预训练过程。
这项研究的重要意义在于为畜牧业研究者提供了明确的技术选型指导。对于追求最高跟踪精度的应用场景,ByteTrack等监督式MOT方法是较优选择;而在缺乏标注数据或需要快速部署的情况下,Track-Anything和PromptTrack等新兴无监督方法提供了可行的替代方案。
未来研究方向应包括开发这些新工具的独立图形界面,降低使用门槛,促进在非技术背景的研究人员中的推广应用。此外,如何提高长期跟踪中的身份一致性,减少身份切换累积效应,仍是需要持续探索的技术挑战。
这项研究不仅推动了多动物追踪技术从传统方法向现代计算机视觉方法的转型,也为精准畜牧业的发展提供了重要的技术支撑。随着这些先进追踪技术的不断完善和普及,畜牧业将能够实现更加精细化、智能化的管理,最终促进动物福利的提升和养殖效益的优化。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号