V2-Fusion:基于虚拟体素增强的4D雷达-图像特征融合在3D目标检测中的研究
《Exploratory Research in Clinical and Social Pharmacy》:V2-Fusion: Virtual Voxel Enhanced 4D Radar-Image Feature Fusion for 3D Object Detection
【字体:
大
中
小
】
时间:2025年10月27日
来源:Exploratory Research in Clinical and Social Pharmacy 1.8
编辑推荐:
本文提出了一种名为V2-Fusion的创新检测方法,旨在解决4D雷达数据稀疏和缺乏表面纹理的挑战。该方法通过体素级前景语义特征增强模块(VFSFE)利用图像语义信息稠密化前景雷达体素,并通过目标上下文纹理特征聚合模块(OCTFA)扩大感受野以缓解投影未对准误差。在View-of-Delft(VoD)和Dual-Radar数据集上的实验表明,该方法显著提升了3D目标检测性能,为自动驾驶感知任务提供了鲁棒解决方案。
我们的研究强调了利用图像信息来增强稀疏4D雷达数据表示的重要性。通过提出的V2-Fusion方法,我们展示了如何有效地结合雷达的精确3D信息和图像的丰富语义内容,以改善在具有挑战性的天气条件下的3D目标检测性能。
Multimodal Fusion Method for 3D object detection for autonomous driving
3D目标检测中的多模态融合涉及处理激光雷达(LiDAR)和相机数据组合时的不同融合阶段,即早期融合(early fusion)、中期融合(mid fusion)和晚期融合(late fusion)。在早期融合中,主要焦点是在数据级别整合LiDAR和图像数据。
V2-Fusion包含两个主要模块:VFSFE和OCTFA。我们提出了一个两阶段的体素级前景语义特征增强模块(VFSFE)来稠密化前景体素并突出前景信息,以解决4D雷达的稀疏性问题。此外,我们引入了目标上下文纹理特征聚合模块(OCTFA),通过扩大感受野来减轻投影未对准的影响。
我们使用View-of-Delft(VoD)和Dual-Radar数据集来评估我们方法的性能。
VoD数据集。 View-of-Delft(VoD)数据集从代尔夫特的校园、郊区和旧城区收集,包含8,600帧来自64线LiDAR、(立体)相机和4D雷达的同步和校准数据。它包含超过123,000个3D边界框标注,例如约26,000个行人、10,000个骑自行车者和26,000个汽车标签。车辆传感器是挡风玻璃上的IDS立体相机(1936×1216,30 fps)和一个前置4D成像雷达。
我们提出了一种新颖的方法V2-Fusion,旨在增强稀疏4D雷达数据背景下的3D目标检测。我们方法的核心是一个VFSFE模块,它利用图像语义分割信息来稠密化前景雷达体素,以缓解雷达稀疏性问题。此外,我们提出了一个OCTFA模块,通过整合邻近像素的信息来显著提高分割质量,从而增强鲁棒性。我们的...
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号