PolarLane:基于极坐标的可靠纯电动汽车(BEV)车道检测技术

《Expert Systems with Applications》:PolarLane: Robust BEV Lane Detection based on Polar Coordinates

【字体: 时间:2025年11月03日 来源:Expert Systems with Applications 7.5

编辑推荐:

  基于极坐标系的3D车道检测方法PolarLane通过构建与摄像头成像特性匹配的极坐标检测空间,采用滑动条式卷积和极坐标编码器,有效解决传统笛卡尔坐标系下几何扭曲与信息分布不均问题,在OpenLane、ONCE-3DLanes等数据集上取得SOTA性能。

  在自动驾驶技术的发展过程中,环境感知是实现智能驾驶的核心环节之一,而车道检测作为其中的关键任务,直接影响着车辆的行驶安全与路径规划的准确性。传统的车道检测方法主要依赖于二维图像处理技术,虽然在实时性方面表现出色,但在描述车道的三维空间结构时存在明显不足。随着深度学习的不断进步,研究者们逐渐转向三维车道检测,希望通过更精确的几何建模来增强系统对复杂道路环境的理解能力。然而,当前主流的三维车道检测方法大多采用笛卡尔坐标系进行空间建模,这种方法在实际应用中面临两个主要问题:一是笛卡尔坐标系的均匀划分与相机成像的径向几何特性存在冲突,导致模型需要通过复杂的空间变换来补偿几何畸变;二是车道检测的本质在于预测车道点,但在笛卡尔空间中对点的定义引入了不必要的非线性因素,这主要是由于透视效应所引起的。为了解决这些问题,本文提出了一种基于极坐标系的三维车道检测方法——PolarLane。

PolarLane的核心创新在于将检测空间建模为一个以相机光心为原点的极坐标系。这种建模方式能够更好地匹配相机的成像模型,同时更自然地反映信息的分布特性。在极坐标系中,空间点的定义由径向距离、方位角和高度角组成,这种参数化方式不仅能够紧密描述空间点的分布情况,还能有效避免笛卡尔坐标系中因均匀划分导致的空间冗余问题。具体而言,传统的笛卡尔坐标系在处理图像信息时,往往需要将大量的空间区域纳入考虑范围,但实际上这些区域可能并不包含有效的外部信息,从而容易导致检测结果超出图像的视野范围。此外,笛卡尔坐标系对远距离和近距离的信息处理方式较为统一,忽略了信息密度的变化,使得模型在处理近距离信息时未能给予足够的关注,影响了检测的准确性。

在PolarLane的设计中,我们引入了一种特殊的滑动条状窗口卷积机制,以替代传统的卷积操作。这种卷积窗口的设计充分考虑了车道线在图像中呈现的径向分布特性,其方向与车道线的几何特性高度匹配。通过这种方式,PolarLane能够更有效地捕捉车道线的连续特征,避免了传统卷积操作对长形结构的截断问题。同时,这种轴向对齐的卷积窗口设计使得特征提取过程能够更自然地学习极坐标系中的空间关系,从而提升模型对车道线的建模能力。

为了进一步增强模型的几何感知能力,我们还设计了一种极坐标编码机制,用于注入几何先验信息。通过分析相机成像的原理,我们发现每个像素在图像中的位置与其在三维空间中的几何关系之间存在隐含的约束条件。基于这一发现,我们在PolarLane中明确编码了两种关键的几何信息:一是像素与图像中心之间的径向距离,这一信息直接反映了物体在三维空间中的接近程度;二是由相机内参计算得出的精确视角,这一信息建立了角度坐标与真实三维方向之间的对应关系。在实现过程中,我们采用了一种可学习的多层感知机(MLP)将这些几何先验信息转换为高维的特征表示,并将其与图像特征进行深度融合。这一设计使得网络能够在最初阶段就理解透视变换的原理,从而降低学习几何变换的难度。与传统的坐标变换不同,我们的方法更注重将透视投影的物理规律作为强先验注入到特征表示中,以实现更精确的三维空间推理。

此外,为了提升模型在复杂场景下的全局拓扑建模能力,我们还引入了一种实例提取器。该实例提取器能够从图像中提取车道线的全局拓扑结构,使得模型在处理多车道实例混淆或遮挡问题时,能够更有效地解决特征模糊问题。这种实例提取器与极坐标编码机制相结合,形成了一个相互增强的架构,从而显著提升了检测的鲁棒性。

在实验部分,我们对PolarLane进行了全面评估,并在三个公开的三维车道检测数据集上进行了测试:OpenLane、ONCE-3DLanes 和 Apollo Synthetic。其中,OpenLane 是一个基于 Waymo 数据集构建的大型三维车道检测数据集,包含 1,000 个视频片段,共计 200,000 帧图像,这些图像在不同的天气条件、地形和光照下进行采集,分辨率为 1280×1920。OpenLane 包含 880,000 个车道标注,分布在 14 个类别中,提供了多样且真实的道路环境信息。ONCE-3DLanes 则是一个基于单目视觉的三维车道检测数据集,它通过多阶段特征提取网络来捕捉车道线的几何特性,并利用单目视觉技术来估计车辆与道路之间的距离。Apollo Synthetic 是一个合成数据集,用于模拟自动驾驶场景下的车道检测问题。在这些数据集上,PolarLane 展现出了卓越的性能,不仅在检测精度上取得了显著提升,还在检测的鲁棒性方面表现出色。

从实验结果来看,PolarLane 在多个关键指标上均优于现有的三维车道检测方法。例如,在 F1 分数这一衡量检测精度和召回率的综合指标上,PolarLane 的表现显著优于传统方法。此外,在处理复杂场景下的多车道实例混淆和遮挡问题时,PolarLane 能够更准确地识别车道线的拓扑结构,避免了因遮挡或混淆导致的误检问题。这些优势使得 PolarLane 在实际应用中具备更高的可靠性和实用性。

总的来说,本文提出了一种基于极坐标系的三维车道检测方法——PolarLane,该方法能够有效解决传统笛卡尔坐标系在空间建模中存在的问题。通过将检测空间建模为极坐标系,并采用滑动条状窗口卷积机制和极坐标编码机制,PolarLane 在检测精度和鲁棒性方面均取得了显著提升。同时,该方法还为三维车道检测提供了新的研究方向,有助于推动自动驾驶技术的发展。未来的研究可以进一步探索极坐标系在其他环境感知任务中的应用,如障碍物检测、行人识别等,以实现更全面的自动驾驶感知系统。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号