利用机载激光扫描数据及其衍生的点云指标,在双流深度学习框架下对单个树种进行预测

《International Journal of Applied Earth Observation and Geoinformation》:Individual tree species prediction using airborne laser scanning data and derived point-cloud metrics within a dual-stream deep learning approach

【字体: 时间:2025年09月25日 来源:International Journal of Applied Earth Observation and Geoinformation 8.6

编辑推荐:

  树种分类双流深度学习模型在森林资源管理中的应用。提出融合LiDAR原始点云和统计指标的自动化方法,解决传统手动标注效率低的问题,在630,000公顷 boreal森林中生成16,269个标注点云,模型准确率提升11%,F1-score达0.70,ROC AUC达0.88。

  ### 介绍

在森林管理和生态系统研究中,准确识别和分类树种是一项基础性任务。传统的森林调查通常依赖于人工方法,例如利用航空影像进行目视判读以及分层地面采样。这种方法虽然在小规模森林区域中较为常见,但在大规模应用时却面临效率低下和成本高昂的问题。近年来,随着激光雷达(LiDAR)技术的发展,特别是机载激光雷达(ALS)的广泛应用,为森林资源调查提供了新的可能性。ALS能够获取高精度的三维点云数据,为森林结构分析和树种分类提供了丰富的信息。然而,即便在ALS数据的支持下,树种分类仍然面临挑战,尤其是在树种多样性高的混合森林中,手动分类的准确性较低,且难以满足大规模数据处理的需求。

为了解决这一问题,本文提出了一种自动化、数据驱动的双流深度学习(DL)框架,该框架结合了ALS点云数据与点云特征指标,以实现对个体树种的精准识别。这一方法不仅提高了分类的准确性,还减少了对人工操作的依赖,从而提升了整体的可扩展性。研究团队在安大略省的罗密欧·马莱特森林(Romeo Malette Forest, RMF)中进行了实验,该森林面积达63万公顷,是加拿大北方针叶林区的一部分,涵盖了多种树种。通过自动化的个体树分割和分类流程,研究人员生成了包含16,269个标记个体树点云的数据集,并利用该数据集训练和评估了多个深度学习模型。

### 方法

为了实现个体树的自动分类,研究团队首先利用现有的森林调查数据和现场数据,生成了包含树种标签的点云数据集。这些数据来源于53个圆形样地,每个样地的半径为11.28米,面积为400平方米。这些样地的中心位置和树种信息通过GPS设备记录,并结合了假样地数据,这些假样地是基于森林资源调查(FRI)多边形生成的,且每个假样地都具有单一树种的组成。通过对这些样地进行分割和标记,研究人员能够获得足够的数据用于训练深度学习模型。

接下来,研究团队使用不同的点云特征指标来辅助深度学习模型。这些指标包括冠层高度、冠层大小和复杂性、信号衰减深度和强度等。通过计算这些指标的方差膨胀因子(VIF),研究人员确保了特征之间的低共线性,并筛选出最有效的指标。最终,研究人员选择了16个关键的点云特征指标,这些指标涵盖了垂直分布、冠层几何特征以及辐射特性。

为了实现树种分类,研究团队设计了一个双流深度学习模型。其中,一个流用于处理原始的点云数据,另一个流则用于处理从点云中提取的特征指标。原始点云数据通过一个模块化的点提取器(Point Extractor)进行处理,该提取器能够利用不同的点云处理层(如EdgeConv和Point Transformer)来提取高维特征。而特征指标则通过一个称为Metrics Network的网络进行处理,该网络基于注意力机制,能够对不同特征的权重进行动态调整,从而提高分类的准确性。

在模型训练过程中,研究团队采用了一种组合损失函数,其中包括加权交叉熵损失(weighted cross-entropy loss)和中心损失(center loss)。这种损失函数不仅能够提高分类的准确性,还能在类别不平衡的情况下,优化特征的分布。此外,研究团队还使用了Adam优化器,并通过学习率调度器(scheduler)对模型进行调整,以防止过早收敛并提高模型的泛化能力。

### 结果

研究团队在测试数据集上评估了不同模型的性能。测试数据集包含2441棵树的点云数据,其中黑松(black spruce)和红松(jack pine)的分类准确率较高,而白桦(paper birch)和颤杨(trembling aspen)的准确率相对较低。总体来看,加入Metrics Network的双流模型在多个评估指标上都优于仅使用原始点云数据的模型。例如,使用EdgeConv层的模型在加入Metrics Network后,准确率从0.55提高到了0.69,而Point Transformer层的模型准确率则从0.61提高到了0.69。此外,加入Metrics Network的模型在F1分数、精确度(precision)和召回率(recall)方面也均有所提升,尤其是在分类黑松和红松时表现更为出色。

在模型的预测概率方面,加入Metrics Network的模型也显示出更高的可靠性。通过对比不同模型的预测结果,研究人员发现,使用双流模型能够更准确地预测所有四个树种的出现概率,从而提高了整体预测的稳定性。此外,校准图(calibration plots)进一步验证了模型的可靠性,表明双流模型在预测概率与实际类别分布之间具有更高的一致性。

### 分析与讨论

研究团队还分析了不同点云处理层对模型性能的影响。EdgeConv和Point Transformer分别展示了不同的优势,其中Point Transformer在单独使用时表现最佳,而EdgeConv在结合Metrics Network后表现更优。这种差异可能与不同层对点云结构的处理方式有关,例如Point Transformer通过注意力机制能够更有效地捕捉点云中的关键特征,而EdgeConv则通过边卷积(edge convolution)提取局部几何特征。

此外,研究团队还探讨了点云特征指标在模型中的作用。在所有模型中,Z_skew、N_points和I_q50这三个指标均表现出较高的特征注意力(feature attention),这表明它们在树种分类中具有重要的作用。这些指标可能反映了树种在垂直结构、冠层密度和反射特性方面的差异。然而,Volume和Area这两个指标在所有模型中均表现出较低的特征注意力,这可能与罗密欧·马莱特森林中不同树种的冠层密度和分布有关。未来的研究可以考虑在不同传感器和区域中重新训练模型,以优化这些指标的表现。

尽管双流模型在大多数情况下表现出色,但研究团队也指出了其局限性。例如,使用分水岭算法(watershed segmentation)进行个体树分割可能会引入误差,从而影响模型的预测结果。此外,由于数据集中某些树种(如白桦和颤杨)的样本数量较少,模型在预测这些树种时的准确率较低。为了解决这一问题,研究团队采用了加权交叉熵损失,以鼓励模型更关注这些树种的预测。然而,这种策略并未完全解决样本数量不足带来的影响,表明在未来的模型开发中,可能需要引入更多的样本数据,或者结合其他数据源(如光谱信息)以提高模型的泛化能力。

### 结论

本研究通过提出一种自动化、数据驱动的双流深度学习框架,展示了如何利用机载激光雷达数据和点云特征指标来实现对个体树种的精准分类。这种方法不仅提高了分类的准确性,还减少了对人工操作的依赖,为大规模森林资源调查提供了可行的解决方案。研究团队的实验结果表明,双流模型在多个评估指标上均优于传统的单流模型,尤其是在分类黑松和红松时表现更为优异。此外,加入Metrics Network的模型在预测概率和模型校准方面也具有显著优势。

未来的研究可以进一步探索如何优化点云处理层和特征指标的组合,以提高模型在不同树种和森林类型中的表现。此外,引入其他数据源(如光谱信息)可能有助于提高模型的泛化能力,特别是在处理样本数量较少的树种时。最后,研究团队强调,尽管当前的模型在大多数情况下表现良好,但仍然需要进一步改进,以减少由于分割误差和样本不平衡带来的影响。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号