基于体素全稀疏注意力机制的轨道交通障碍物3D检测系统RVSA-3D

【字体: 时间:2025年08月25日 来源:Pattern Recognition 7.6

编辑推荐:

  (编辑推荐)本文提出RVSA-3D框架,通过子流形池化注意力(SPA)、多尺度信息融合(MIF)和高置信稀疏注意力(HSA)三大模块,创新性实现轨道交通场景下远距离稀疏障碍物的高效检测。该研究在KITTI和Rail3D数据集上取得SOTA性能,为智能铁路安全运营提供关键技术支撑。

  

Highlight

本文亮点在于RVSA-3D框架通过全稀疏架构突破传统检测瓶颈:

  1. 1.

    SPA模块将子流形稀疏卷积(Submanifold Sparse Convolution)与注意力机制结合,显著提升小目标特征保留能力

  2. 2.

    MIF模块采用跨尺度自注意力(Cross-scale Self-attention)实现多层级特征对齐

  3. 3.

    HSA模块通过动态生成类感知查询(Class-aware Queries),以分层交叉注意力(Hierarchical Cross-attention)聚合全局上下文

Methodology

如图2所示,RVSA-3D包含三大核心组件:

  • SPA模块(3.2节):在稀疏骨干网中保留关键区域特征,通过坐标哈希映射实现高效下采样

  • MIF模块(3.3节):构建金字塔特征交互网络,采用可变形卷积(Deformable Convolution)补偿尺度差异

  • HSA模块(3.4节):基于目标置信度动态筛选查询点,通过多头注意力(Multi-head Attention)融合局部细节与全局语义

Datasets

Rail3D数据集

  • 包含地铁隧道/开放轨道双场景

  • 采用两种LiDAR设备(见表1参数)

  • 涵盖行人/车辆等6类障碍物模拟真实入侵场景

Conclusion

RVSA-3D通过全稀疏处理范式,在保持实时性的同时:

  1. 1.

    对200米外障碍物检测精度提升23.6%

  2. 2.

    推理速度达45FPS(帧/秒)

  3. 3.

    在KITTI自行车类检测AP40达78.3%

Uncited Reference

[32] 未引用文献说明

CRediT作者贡献声明

第一作者Lirong Lian完成核心算法设计;通讯作者Yong Qin提供基金支持;Zhiwei Cao指导工程实现;其他成员参与数据采集。

Declaration of competing interest

作者声明无利益冲突

Funding

资助信息:

  • 中国博士后科学基金(GZC20251118)

  • 轨道交通控制与安全国家重点实验室专项(RAO2025ZR001/RAO2023ZZ003)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号