
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DRIR-Net:基于双分支旋转不变性与鲁棒性网络的3D场景识别方法研究
【字体: 大 中 小 】 时间:2025年06月29日 来源:Neurocomputing 5.5
编辑推荐:
针对自动驾驶中3D点云场景识别存在的预处理耗时、视角旋转敏感及噪声干扰等问题,哈尔滨工业大学团队提出双分支旋转不变鲁棒网络DRIR-Net。该研究通过子区域下采样、局部位置编码和Transformer增强模块,实现了对噪声和旋转视角的鲁棒性,在USyd等数据集上超越现有方法,为复杂环境下的SLAM系统提供了高效解决方案。
在自动驾驶和机器人导航领域,3D点云(LiDAR)场景识别是实现精确定位与地图构建(SLAM)的核心技术。然而,现有学习方法面临三大挑战:传统下采样策略计算效率低下,难以应对传感器噪声干扰;点云坐标系以自我为中心,不同视角下同一场景的数据差异显著;现有方法多依赖2D投影导致三维空间信息丢失。这些问题严重制约了复杂户外环境中的定位精度和系统实时性。
为突破这些瓶颈,哈尔滨工业大学的研究团队在《Neurocomputing》发表论文提出DRIR-Net网络。该研究创新性地结合极坐标子区域分割与最远点采样(FPS),将预处理时间降低80%;设计子区域金字塔池化(SPP)模块和位置编码增强的Transformer块,首次在3D空间实现旋转等变特征提取;通过子区域交叉注意力(SCA)机制融合点-体素特征,在保持细粒度信息的同时提升大尺度结构感知能力。实验表明,该方法在USyd、Oxford RobotCar和KITTI数据集上的召回率较基线模型提升12%-15%,对旋转视角和噪声场景表现出卓越的泛化能力。
关键技术方法包括:基于LiDAR扫描特性的极坐标子区域分割、局部位置编码与k近邻特征聚合、子区域金字塔池化(SPP)构建多尺度特征、改进Transformer块生成旋转等变描述符,以及子区域交叉注意力(SCA)实现点-体素特征对齐。训练数据来自USyd数据集19,138组点云和Oxford RobotCar的21,694组扫描序列。
研究结果:
结论与意义:该研究开创性地将子区域结构与多特征融合相结合,解决了3D场景识别中的计算效率、旋转敏感和噪声干扰三大难题。DRIR-Net不仅为自动驾驶提供了实时可靠的定位方案,其子区域特征编码思想对三维视觉领域的旋转等变建模具有普适价值。研究获得中国航空科学基金(2022Z0710-77002)和黑龙江省自然科学基金(LH2021F026)支持,相关技术已应用于高动态环境下的SLAM系统开发。
生物通微信公众号
知名企业招聘