
-
生物通官微
陪你抓住生命科技
跳动的脉搏
YOLO-Ro-KCF:一种轻量级的、基于梯度引导的实时多目标跟踪框架,适用于嵌入式无人机视觉系统
《Scientific Reports》:YOLO-Ro-KCF: a lightweight gradient-guided real-time multi-object tracking framework for embedded UAV vision systems
【字体: 大 中 小 】 时间:2026年06月12日 来源:Scientific Reports 3.9
编辑推荐:
摘要来自无人驾驶飞行器(UAV)的鲁棒视觉多目标跟踪(MOT)仍然是一个巨大的挑战,因为存在大量小目标、杂乱背景、运动模糊以及频繁的遮挡现象。为了解决资源受限的嵌入式环境中的这些挑战,我们提出了YOLO-Ro-KCF,这是一个新颖的、轻量级的、实时的MOT框架,它将梯度域先验有效
来自无人驾驶飞行器(UAV)的鲁棒视觉多目标跟踪(MOT)仍然是一个巨大的挑战,因为存在大量小目标、杂乱背景、运动模糊以及频繁的遮挡现象。为了解决资源受限的嵌入式环境中的这些挑战,我们提出了YOLO-Ro-KCF,这是一个新颖的、轻量级的、实时的MOT框架,它将梯度域先验有效地整合到了检测和跟踪过程中。我们的核心创新在于建立了一种统一的、基于梯度的特征表示方法和闭环协同优化机制。YOLO-Ro检测器引入了经过伽马校正的梯度幅度图作为辅助输入通道,显著提高了其对纹理较弱的小目标的区分能力。同时,KCF-Ro跟踪器通过融合梯度方向线索与定向梯度直方图(HOG)特征,并采用多尺度搜索策略,从而在应对尺度变化和部分遮挡时表现出更强的鲁棒性。动态融合模块通过利用空间重叠和速度一致性,自适应地协调检测和跟踪假设。在三个具有挑战性的基准测试——VisDrone2019、UAVDT和Anti-UAV——上的广泛实验表明,YOLO-Ro-KCF取得了业界领先的性能,在NVIDIA Jetson AGX Xavier平台上以43 FPS的帧率运行时,其MOTA(多目标检测准确率)达到了70.6%,HOTA(多目标跟踪准确率)达到了72.1%。全面的消融研究、基于属性的评估以及跨数据集的泛化测试(均显示出2.1%至4.5%的一致性提升)都验证了我们方法的有效性和鲁棒性。这项工作为高精度、低延迟的基于UAV的视觉跟踪建立了一个实用且可部署的范式。
生物通微信公众号