UncertainBEV:面向路侧三维目标检测的不确定性感知鸟瞰图(BEV)融合方法

【字体: 时间:2025年05月27日 来源:Image and Vision Computing 4.2

编辑推荐:

  在路侧 3D 目标检测中,多模态融合存在传感器校准误差导致的特征错位问题。研究人员提出 UncertainBEV 框架,引入 UncertainFuser 模块建模特征不确定性,优化稀疏体素池化并设计多头注意力机制。在 DAIR-V2X-I 数据集上,车辆、行人、 cyclists 的 3D mAP 分别提升 2.88%、7.73%、3.68%,为路侧感知提供新方案。

  随着自动驾驶与智能交通系统的蓬勃发展,精准的环境感知成为关键。然而,路侧三维(3D)目标检测中,摄像头与激光雷达(LiDAR)等多传感器融合时,因视角差异、时间同步偏差、数据分辨率不同及校准矩阵误差等问题,常出现特征错位,严重影响检测性能。传统方法如 BEVFusion 虽在鸟瞰图(BEV)空间融合数据,但忽视了实际应用中的特征错位,导致检测精度受限。如何高效融合多模态数据并解决特征错位,成为提升路侧 3D 目标检测准确性与鲁棒性的核心挑战。
为攻克这一难题,国内研究机构(文中未明确提及具体单位,但从代码开源地址 “NUST-Machine-Intelligence-Laboratory” 推测为国内高校或科研院所)的研究人员开展了相关研究,提出了 UncertainBEV 框架。该研究成果发表在《Image and Vision Computing》,为路侧多模态感知提供了新的解决思路。

研究人员采用的主要关键技术方法包括:一是优化稀疏体素池化模块,借鉴 BEVSpread 的扩散体素池化策略,将每个平截头体点作为源点,通过自适应权重将图像特征扩散到周围 BEV 网格,并引入定位近似误差校准(PAEC)模块,在降低计算复杂度的同时减少位置近似误差;二是设计 UncertainFuser 模块,基于贝叶斯负对数似然(NLL)损失对多模态特征的不确定性进行建模,生成各模态的权重并动态调整,实现多模态特征的精准对齐;三是引入多头注意力(MHA)机制,针对 LiDAR 点云高维稀疏的特点,提取更精细丰富的特征,为多模态融合提供精准信息。

实验结果


在 DAIR-V2X-I 和 DAIR-V2X-Seq 数据集上的实验表明,与基线方法相比,UncertainBEV 在车辆、行人、骑行者三类目标的 3D 平均精度均值(mAP)上分别提升了 2.88%、7.73% 和 3.68%,显著优于现有方法,验证了其有效性。

消融实验


通过对各模块的消融研究发现,PAEC 模块和 UncertainFuser 模块均对性能提升有显著贡献。PAEC 模块有效减少了摄像头到 BEV 转换过程中的位置近似误差,而 UncertainFuser 模块通过建模特征不确定性,动态调整融合权重,进一步解决了全局特征错位问题,多头注意力机制则增强了 LiDAR 特征的表达能力。

研究结论表明,UncertainBEV 框架通过多模块协同作用,有效解决了路侧多模态融合中的特征错位难题,显著提升了 3D 目标检测性能。该研究为自动驾驶路侧感知系统提供了更鲁棒的多模态融合方案,有助于提升自动驾驶的安全性与可靠性,对推动智能交通系统的发展具有重要意义。未来研究可进一步探索更高效的不确定性建模方法,以适应复杂动态场景下的实时感知需求。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号