
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于帧间运动关联的MoCoPCI:高效三维点云插值新方法
【字体: 大 中 小 】 时间:2025年07月31日 来源:Pattern Recognition 7.6
编辑推荐:
针对LiDAR点云数据因硬件限制导致的时间分辨率不足问题,电子科技大学团队提出MoCoPCI框架,通过运动相关性双向流预测和跨注意力机制,实现非线性运动轨迹的高效插值。该方法在NuScenes数据集上将Chamfer距离降低24.35%,推理速度提升2倍,为自动驾驶等领域提供重要技术支撑。
在自动驾驶和机器人领域,LiDAR传感器生成的3D点云数据犹如环境的"数字骨骼",能精确描绘周围物体的空间结构。然而主流LiDAR如Velodyne HDL-64E的帧率仅10-20Hz,这种"慢动作"般的采样频率会导致动态场景中出现"动作卡顿",严重影响多传感器融合效果。传统解决方案如同"补帧动画",要么依赖硬件升级增加成本,要么采用伪点云生成导致信息丢失。更棘手的是,真实场景中车辆、行人等物体的运动轨迹往往呈现复杂的非线性特征,而现有方法要么像"逐帧手绘"般耗时(神经场方法),要么像"线性插补"般失真(运动估计方法),难以兼顾效率与精度。
电子科技大学信息与软件工程学院的研究团队在《Pattern Recognition》发表的这项研究,犹如为点云插值领域装上了"时空引擎"。他们开发的MoCoPCI框架创新性地采用EI Crossformer捕捉多尺度运动信息,通过金字塔式Convolution-Transformer架构一次性预测所有中间帧的双向流,配合轨迹细化模块,实现了"一击即中"的高效插值。该方案在NuScenes数据集上不仅将Chamfer距离误差大幅降低24.35%,更以2倍的推理速度优势超越现有方法,为实时环境感知提供了新范式。
关键技术包括:1)基于外推-注入的EI Crossformer跨注意力机制;2)卷积-Transformer混合的金字塔流估计模块;3)点级轨迹补偿机制;4)融合多尺度损失、双向损失和预测损失的新型损失函数。所有实验均基于公开户外数据集进行验证。
【方法设计】
研究团队构建的端到端网络包含四大核心模块:提取注入交叉变换器(EI Crossformer)通过多尺度特征提取建立全局感受野;混合结构流估计模块采用3D稀疏卷积与Transformer结合的金字塔架构,同步预测所有中间帧的双向流;轨迹细化模块通过残差学习补偿非线性运动分量;融合头模块最终生成高质量点云序列。
【性能验证】
在NuScenes数据集上的对比实验显示,MoCoPCI的Chamfer距离降至0.428,较FastPCI提升24.35%。可视化分析表明,该方法在车辆转弯等非线性运动场景中能保持更完整的结构特征。消融实验验证了EI Crossformer对复杂运动建模的关键作用,其双向流预测策略使推理速度达到23.4Hz,远超传统迭代式方法的10Hz。
【结论启示】
这项研究突破了点云插值领域"效率-精度不可兼得"的困境。MoCoPCI的创新性体现在:1)首次实现基于运动相关性的"单次预测"框架,通过共享帧间运动信息确保时间一致性;2)提出的EI Crossformer机制为3D运动建模提供了新思路;3)实践层面为自动驾驶实时系统提供了可行方案。未来工作可进一步探索动态场景下的自适应插值策略,推动该技术在边缘计算设备上的部署应用。
生物通微信公众号
知名企业招聘