
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于体素全稀疏注意力机制的轨道交通障碍物3D检测系统RVSA-3D
【字体: 大 中 小 】 时间:2025年08月25日 来源:Pattern Recognition 7.6
编辑推荐:
(编辑推荐)本文提出RVSA-3D框架,通过子流形池化注意力(SPA)、多尺度信息融合(MIF)和高置信稀疏注意力(HSA)三大模块,创新性实现轨道交通场景下远距离稀疏障碍物的高效检测。该研究在KITTI和Rail3D数据集上取得SOTA性能,为智能铁路安全运营提供关键技术支撑。
Highlight
本文亮点在于RVSA-3D框架通过全稀疏架构突破传统检测瓶颈:
SPA模块将子流形稀疏卷积(Submanifold Sparse Convolution)与注意力机制结合,显著提升小目标特征保留能力
MIF模块采用跨尺度自注意力(Cross-scale Self-attention)实现多层级特征对齐
HSA模块通过动态生成类感知查询(Class-aware Queries),以分层交叉注意力(Hierarchical Cross-attention)聚合全局上下文
Methodology
如图2所示,RVSA-3D包含三大核心组件:
SPA模块(3.2节):在稀疏骨干网中保留关键区域特征,通过坐标哈希映射实现高效下采样
MIF模块(3.3节):构建金字塔特征交互网络,采用可变形卷积(Deformable Convolution)补偿尺度差异
HSA模块(3.4节):基于目标置信度动态筛选查询点,通过多头注意力(Multi-head Attention)融合局部细节与全局语义
Datasets
Rail3D数据集:
包含地铁隧道/开放轨道双场景
采用两种LiDAR设备(见表1参数)
涵盖行人/车辆等6类障碍物模拟真实入侵场景
Conclusion
RVSA-3D通过全稀疏处理范式,在保持实时性的同时:
对200米外障碍物检测精度提升23.6%
推理速度达45FPS(帧/秒)
在KITTI自行车类检测AP40达78.3%
Uncited Reference
[32] 未引用文献说明
CRediT作者贡献声明
第一作者Lirong Lian完成核心算法设计;通讯作者Yong Qin提供基金支持;Zhiwei Cao指导工程实现;其他成员参与数据采集。
Declaration of competing interest
作者声明无利益冲突
Funding
资助信息:
中国博士后科学基金(GZC20251118)
轨道交通控制与安全国家重点实验室专项(RAO2025ZR001/RAO2023ZZ003)
生物通微信公众号
知名企业招聘