MonoFG:基于知识蒸馏的单目3D物体检测技术,用于以人为中心的自动驾驶系统
《ACM Transactions on Autonomous and Adaptive Systems》:MonoFG: Monocular 3D Object Detection with Knowledge Distillation for Human-Centric Autonomous Driving Systems
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Autonomous and Adaptive Systems
编辑推荐:
单目3D目标检测通过知识蒸馏分离前景背景优化定位精度,特征响应双蒸馏机制提升模型能力,实验验证在KITTI数据集上优于基准方法
摘要
单目3D物体检测对于识别道路图像中的物体至关重要,因此可以为以人为中心的自动驾驶系统提供宝贵的环境感知数据。然而,由于相机成像的固有局限性,仅从图像中获取精确的深度信息是具有挑战性的,这影响了场景内物体定位的准确性。在本文中,我们介绍了一种名为MonoFG的单目3D物体检测方法,该方法利用分离前景和背景组件的知识蒸馏来提高物体定位的准确性。首先,分离的前景和背景蒸馏过程可以战略性地利用从每个位置获取的不同位置信息来优化生成的全局蒸馏效果。这一步是为后续的特征和响应蒸馏过程奠定基础,后续过程关注的是蒸馏后的前景和背景,而不是孤立的物体蒸馏。其次,基于三重注意力机制的特征蒸馏增强了学生网络的特征模仿和特征表示能力。空间和通道注意力机制鼓励学生网络从教师网络中捕获关键像素和通道,而自注意力机制则在全球范围内传递像素之间的学习关系。第三,基于定位误差的响应蒸馏有助于更清晰地从教师网络向学生网络传递位置信息。只有当教师网络的位置能力超过学生网络时,才能在前景和背景之间全面蒸馏知识。因此,蒸馏过程被限制在特定内容上,这些内容由作为边界的定位误差来界定。最后,在KITTI基准数据集上进行的实验表明,我们的方法在涉及以人为中心的自动驾驶系统的几个代表性评估任务(例如3D物体检测和鸟瞰图(BEV)检测)中表现优于许多知名的基线方法。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号