基于激光雷达视角：一种面向地面点云分割的特征增强与不确定性感知的标注流程

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》：Through the perspective of LiDAR: A feature-enriched and uncertainty-aware annotation pipeline for terrestrial point cloud segmentation

【字体：大中小】 时间：2026年04月02日 来源：ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING 12.2

编辑推荐：

　　准确的地面激光扫描（Terrestrial Laser Scanning, TLS）点云语义分割受到高昂的人工标注成本限制。研究人员提出了一种半自动化、不确定性感知的流程，该流程整合球面投影（spherical projection）、特征增强、集成学习与定向

准确的地面激光扫描（Terrestrial Laser Scanning, TLS）点云语义分割受到高昂的人工标注成本限制。研究人员提出了一种半自动化、不确定性感知的流程，该流程整合球面投影（spherical projection）、特征增强、集成学习与定向标注，以降低标注工作量，同时保持较高的分割精度。该方法将三维点投影至二维球面网格，利用多源特征对像素进行增强，并训练分割网络集成以生成伪标签与不确定性图，后者用于指导模糊区域的标注。二维输出反投影至三维，生成密集标注的点云，并辅以三层级可视化套件（二维特征图、三维彩色点云及紧凑型虚拟球体）以实现快速分拣与审核引导。利用该流程，研究人员构建了Mangrove3D——一个面向红树林的语义分割TLS数据集。进一步的，研究人员评估数据效率与特征重要性以回答两个关键问题：（1）需要多少标注数据，以及（2）哪些特征最为重要。结果表明，性能在约12个标注扫描后即趋于饱和；几何特征的贡献最大；紧凑的九通道堆叠即可捕捉近乎全部判别力，平均交并比（mean Intersection over Union, mIoU）稳定于约0.76。最后，研究人员通过在ForestSemantic与Semantic3D数据集上的跨数据集测试验证了特征增强策略的泛化性。本研究的贡献包括：（i）一个稳健的、不确定性感知的TLS标注流程及可视化工具；（ii）Mangrove3D数据集；以及（iii）关于数据效率与特征重要性的经验性指导，从而为生态监测及其他领域的可扩展、高质量TLS点云分割提供支持。数据集及处理脚本已公开发布于https://fz-rit.github.io/through-the-lidars-eye/。

本研究聚焦于解决地面激光扫描（Terrestrial Laser Scanzing, TLS）点云语义分割中高质量标注数据匮乏及标注成本高昂的核心瓶颈问题。当前，尽管PointNet++等深度学习架构已在点云分割领域超越传统分类器，但其在生态复杂场景中的广泛应用仍受限于两大障碍：其一，全分辨率TLS扫描的手动标注劳动密集度极高，而生态场景中的严重遮挡、不规则几何形态及交织的树木结构进一步加剧了标注难度；其二，现有开源数据集多偏向城市或室内环境，难以代表生态系统的复杂性，导致模型泛化能力不足。为应对上述挑战，研究人员开展了这项研究，旨在构建一个特征增强、不确定性感知的半自动化标注流程，并发布首个专门针对结构复杂的红树林生态系统的TLS基准数据集Mangrove3D，同时验证该流程在跨域场景中的稳健性。

研究人员采用的核心技术方法涵盖以下关键环节：在数据获取层面，Mangrove3D数据集于2024年春季采集自帕劳巴贝尔道布岛的红树林区域，使用Canopy Biomass LiDAR（Version 2.0, CBL）扫描仪，该设备围绕SICK LMS-151激光雷达单元构建，共获取39次TLS扫描，总计3130万点，涵盖地面与水、树干、冠层、根系及物体五类语义类别，其中30次扫描用于训练验证，9次扫描作为固定测试集。在流程架构层面，研究构建了三阶段半自动化标注流程：第一阶段为球面投影与特征增强，将三维点云展开为540×1440像素的二维球面网格，并组织为三组特征——基本属性（辐射强度、距离、反高度）、几何属性（法向量、曲率、各向异性及平面度）及统计属性（主成分分析分量），通过自适应邻域半径与分块处理策略解决尺度与密度变异问题；第二阶段为融合主动学习与自训练的混合标注，以人工标注的少量种子标签训练由UNet++、DeepLabV3+和Segformer组成的模型集成，通过互信息量化解码像素级认知不确定性，高不确定区域由人工精修，高置信区域自动晋升为伪标签，该循环迭代直至全部扫描完成标注，模型采用多编码器融合架构处理扩展通道输入；第三阶段为三维反投影与精细修正，通过k近邻多数投票及随机森林分类器修正投影引起的边界歧义，最终输出紧致虚拟球体作为轻量化三维缩略图。在评估策略层面，研究系统比较了18种特征组合的配置，并通过改变训练样本量（4至28次扫描）评估数据效率，同时在ForestSemantic（北方森林）和Semantic3D（城市场景）两个公开数据集上开展跨域验证。

研究结果部分，研究人员的发现可归纳如下。

2D分割结果方面，分割错误主要集中在冠层-树干过渡区、根系-地面边界等杂乱区域，而这些区域的认知不确定性显著升高，不确定图与误分类像素高度重叠，精确率-召回率曲线下面积（AUPRC）达0.30–0.40，表明不确定性估计能有效定位真实错误。

特征增强效应方面，图13显示，随着特征组逐步扩展，总体准确率介于0.80–0.89，平均类别准确率介于0.78–0.87，mIoU介于0.68–0.76。单通道输入的mIoU为0.702–0.731，三通道组合中对比度增强的I.R.Z堆叠将mIoU提升至0.745；六通道输入进一步推动性能至0.754–0.761，但继续增加通道数收效甚微，最优配置IRZ_N3_CAP的mIoU为0.768。表5表明，推理时间方面单模型为26–64毫秒，集成模型低于150毫秒/扫描。此外，PointNet++基准测试中，仅使用XYZ坐标的基线mIoU为0.634，增加法向量及C.A.P几何描述符后达0.712，此后特征饱和。

数据效率方面，图14显示，所有特征配置的性能均在约12次扫描后趋于饱和；图15表明，随着训练样本增加，总不确定性熵、认知不确定性熵及误差图熵均降低，AUPRC值在12次扫描后收敛。

跨开源数据集泛化方面，ForestSemantic数据集的定性转移验证了多组特征框架对新TLS森林环境的有效性，定量趋势显示几何特征主导性能，IRZ_N3_CAP_PCA配置达最优mIoU 0.511；Semantic3D数据集的二维球面投影图显示多特征图信息互补，IRZ_N3_CAP配置在官方测试集上mIoU达0.516，处于中等排名水平。

讨论部分，研究人员强调了多层可视化策略对场景解译的阐释价值，包括二维球面特征图揭示垂直分层、三维彩色点云支持边界细查、虚拟球体提供全局概览。数据效率方面，约12次扫描的饱和点为野外采样策略提供了参考，不确定性感知采样使有限标注接近峰值性能。特征重要性方面，曲面法向量在三类数据中均表现最为稳定，九通道紧凑配置实现了精度与成本的最优平衡。跨域稳健性方面，纯激光雷达衍生特征确保了RGB影像缺失场景下的适用性，瓶颈层融合设计支持骨干网络灵活替换，伪扫描中心概念可向移动或无人机激光雷达平台延伸。

研究结论部分，研究人员提出了一个特征增强、不确定性感知的TLS点云语义分割流程，其模块化设计整合了多特征组、灵活编码器骨干及集成不确定性估计。在跨越红树林、北方森林与城市环境的基准测试中，该框架持续提升了分割精度，紧凑九通道配置捕获了近乎全部判别力。互补可视化产物对标注引导与场景快速评估具有重要价值。该流程仅依赖激光雷达衍生特征，跨域稳健性良好，定位为林业、生态及城市环境中大规模监测的可扩展、可移植解决方案。研究人员同时指出，尽管传感器融合日益流行，本研究的特征增强结果揭示了激光雷达点云单独使用的未充分挖掘潜力——严谨的特征设计与预处理在某些情况下可超越原始激光雷达-相机融合，展现出通过激光雷达视角观察世界的独特信息维度。未来在预处理策略、骨干网络效率、不确定性评估方法及移动部署方面的进一步优化将拓展其应用范围与影响力。

联系信箱：

粤ICP备09063491号

热点排行