
-
生物通官微
陪你抓住生命科技
跳动的脉搏
城市级点云语义分割新突破:混合尺度与长程交互的集成网络MSLR-Net
【字体: 大 中 小 】 时间:2025年06月19日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对城市点云语义分割中多尺度特征融合不足、长程依赖建模低效等难题,研究人员提出集成混合尺度通道交互(MSCI)模块和双向KNN-Transformer的MSLR-Net网络。通过DIFI块实现几何-纹理特征对齐,MSCI模块动态加权跨尺度特征,结合局部注意力与全局语义引导,在SensatUrban等数据集上mIOU达65.5%,显著提升小物体识别能力,为智慧城市三维场景理解提供新范式。
城市三维点云语义分割是数字孪生和智慧城市建设的核心技术,但现有方法在应对摩天大楼与交通标志共存的复杂场景时,常陷入"顾大失小"的困境。随着无人机LiDAR(激光雷达)和车载雷达的普及,城市级点云数据量已突破亿级规模,传统方法因固定感受野和单向特征传播,难以兼顾20层高楼与2米高路灯的识别需求。更棘手的是,电线杆等小物体因点云稀疏、遮挡严重,其识别准确率往往比建筑物低30%以上。这种尺度鸿沟与上下文断裂问题,严重制约着自动驾驶高精地图构建、城市违建监测等关键应用。
为解决上述挑战,某大学研究团队在《Expert Systems with Applications》发表MSLR-Net网络。该研究基于SensatUrban(7.6km2
)、Toronto3D等真实城市数据集,创新性地将混合尺度通道交互(MSCI)与双向KNN-Transformer结合。关键技术包括:(1)双域特征交互块(DIFI)通过交叉注意力对齐RGB色彩特征与XYZ坐标特征;(2)MSCI模块采用分组卷积生成尺度感知注意力图,动态融合0.5m-50m跨尺度特征;(3)以K近邻(KNN)缩减Transformer计算复杂度,实现局部几何细节与全局语义的闭环交互。
方法创新
DIFI模块 突破传统MLP(多层感知机)仅依赖坐标特征的局限,设计几何-纹理双向交互机制。实验显示,引入HSV色彩空间转换后,交通标线识别F1-score提升12.6%。MSCI模块 通过通道分组策略,使网络对电线杆(2m尺度)和建筑物(>20m尺度)的特征响应权重比达到1:3.8,优于传统拼接融合的1:1.2。双向KNN-Transformer 采用32近邻局部注意力,将GPU显存占用从16GB降至9GB,同时保持85%的全局关联捕获能力。
实验结果
在SansetUrban数据集中,MSLR-Net以65.5% mIOU超越KPConv(58.1%)和PointTransformer(63.2%),其中"自行车"类IoU提升最显著(41.3%→53.7%)。消融实验证实:移除MSCI会使"电线杆"识别率骤降19.4%;而关闭双向交互后,道路-路缘石边界精度损失8.2%。多尺度测试表明,该方法在0.1m-100m尺度范围内保持62%以上分割稳定性,波动幅度小于基准方法35%。
结论与展望
该研究首次实现城市级点云的端到端语义理解,通过三重创新:(1)DIFI模块解决几何-纹理特征割裂问题;(2)MSCI建立动态尺度感知机制;(3)KNN-Transformer实现亿级点云的长程建模。实际部署显示,该方法处理1km2
城市数据仅需22分钟(TITAN RTX显卡),较传统方法提速3倍。未来可结合神经辐射场(NeRF)增强遮挡部位补全能力,或将Transformer查询头扩展至多任务学习框架。这项成果为数字孪生城市提供了可扩展的三维解析方案,其混合尺度思想对医学影像分割等跨尺度分析任务亦有启发价值。
生物通微信公众号
知名企业招聘