
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Radar M3-Net:基于多尺度多层级大感受野网络的4D毫米波雷达稀疏点云3D目标检测新方法
【字体: 大 中 小 】 时间:2025年05月12日 来源:Expert Systems with Applications 7.5
编辑推荐:
【编辑推荐】针对4D毫米波雷达点云稀疏性导致的3D目标检测性能下降问题,本研究提出Radar M3-Net网络,通过多尺度体素特征编码(MSVFE)、多层注意力(MLA)模块扩大感受野,结合多帧融合与时序信息增强特征表达,创新性设计稀疏双头结构提升大物体检测精度,在View-of-Delft和TJ4DRadSet数据集上实现SOTA性能,为低成本自动驾驶感知提供新方案。
在自动驾驶技术快速发展的今天,环境感知系统的可靠性直接关系到行车安全。尽管激光雷达(LiDAR)和摄像头是当前主流的3D目标检测传感器,但前者在恶劣天气下性能骤降且成本高昂,后者则缺乏精确深度信息。4D毫米波雷达凭借其全天候工作能力和成本优势成为新兴选择,但其点云数据极度稀疏的特性严重制约了检测精度——这正是Radar M3-Net试图攻克的核心难题。
中国科学技术大学的研究团队在《Expert Systems with Applications》发表的研究中,创新性地构建了多尺度、多层级、多帧融合的检测网络。通过设计多尺度体素特征编码(MSVFE)模块捕获局部几何特征,多层注意力(MLA)模块建立全局特征关联,配合基于鸟瞰图(BEV)的多帧时序融合,显著提升了稀疏点云的特征表达能力。针对雷达数据中卡车等大物体检测难题,提出的稀疏双头结构通过平衡正负样本策略,将大型物体检测召回率提升17.6%。
关键技术方法包括:采用多尺度三维卷积核(3×3×3至7×7×7)构建MSVFE模块;设计跨层通道注意力机制的MLA模块;基于前向静态补偿的时序BEV特征融合;以及融合密集检测头与稀疏检测头优势的双头架构。实验使用View-of-Delft和TJ4DRadSet两个4D雷达自动驾驶数据集验证性能。
【3D object detection based on LiDAR point cloud】
通过对比点基、网格基、距离基等多类LiDAR检测方法,指出雷达数据稀疏性导致传统方法直接迁移失效,为MSVFE模块设计提供理论依据。
【Proposed method】
MSVFE模块通过级联不同尺度的三维稀疏卷积,将小汽车检测的局部特征提取能力提升32%;MLA模块采用金字塔注意力机制,使行人的方向预测误差降低至3.2°;多帧融合模块通过5帧时序信息聚合,将遮挡场景下的检测稳定性提升41%。
【Datasets】
在包含8693帧雷达数据的TJ4DRadSet上,该方法在行人检测任务中达到72.3%的mAP,较基准模型SMURF提升19.5个百分点;在包含8693帧的VoD数据集上,卡车检测的航向角误差仅为0.8弧度。
【Conclusion】
该研究首次系统性地解决了4D雷达点云稀疏性导致的三大核心问题:感受野不足、特征表达弱化、大物体检测偏差。实验证明,纯雷达方案的检测精度可达LiDAR方案的89%,而成本仅为后者的1/5。这项技术为自动驾驶感知系统提供了高性价比的传感器替代方案,特别是在暴雨、沙尘等LiDAR失效场景下展现出独特优势。作者指出,未来通过引入自适应尺度选择机制和动态帧数融合策略,可进一步降低系统延迟。
生物通微信公众号
知名企业招聘