3D-M2C-ResNet:一种多尺度特征增强与融合模型,用于城市森林中细尺度树种分类
《International Journal of Applied Earth Observation and Geoinformation》:3D-M2C-ResNet: A Multi-Scale feature enhancement and fusion model for Fine-Scale tree species classification in urban forests
【字体:
大
中
小
】
时间:2025年09月25日
来源:International Journal of Applied Earth Observation and Geoinformation 8.6
编辑推荐:
高光谱影像与Sentinel-2时序数据融合的3D-M2C-ResNet模型,通过多尺度 dilated 卷积(MCDC)和多层特征增强策略(MFES)显著提升细粒度城市森林物种分类精度至98.08%,有效解决同类光谱特征和样本不均衡问题。
森林在地球碳汇过程中发挥着关键作用,而不同树种的碳储存能力差异凸显了精确植被分类的必要性。本研究提出了一种名为3D-M2C-ResNet的深度学习模型,用于高分辨率、精细尺度的树种分类。该模型利用融合的遥感输入,结合珠海-1高光谱影像与哨兵-2时间序列数据提取的物候参数,实现了对树种光谱-空间特征的全面提取。模型引入了多尺度级联膨胀卷积(MCDC)模块,通过三分支架构扩展感受野,从而提升对多尺度信息的捕捉能力。此外,还设计了多级特征增强策略(MFES),能够自适应地优化浅层和深层特征,增强跨层的语义-空间集成。实验结果表明,该模型在22,380个像素的测试集上表现优异,整体准确率达到98.08%,Kappa系数达到97.88%,优于基准方法。消融实验进一步验证了MCDC和MFES模块的有效性。值得注意的是,引入物候信息显著提升了对光谱相似树种的分类性能,为精细化的城市森林地图绘制提供了强有力的技术支持,有助于生态监测、碳汇核算和可持续森林管理。
在城市生态系统中,森林不仅是碳吸收的重要场所,还在氧气释放、微气候调节和生物多样性保护方面发挥着重要作用。在中国雄安新区,城市化进程与大规模植树造林工作同步推进,这一区域被形象地称为“一座在公园中生长的城市”。因此,精确的树种级别地图对于指导可持续的城市规划、生态资产估值和碳汇评估具有重要意义。然而,传统的地面调查虽然可靠,但存在人力密集、效率低下和观察者偏倚等问题,难以在区域尺度上及时获取树种级别的信息。为了解决这一问题,遥感技术提供了扩展性强且成本效益高的替代方案,能够快速获取树种分布和动态的空间显式信息。
近年来,多源遥感数据(如多光谱、高光谱和LiDAR)的进展极大地拓展了树种分类的特征空间。其中,高光谱成像(HSI)因其优越的光谱分辨率,能够捕捉到物种间的细微差异,支持高精度的分类。然而,空载高光谱数据往往成本高昂且受限于空域条件,而星载高光谱数据则具有更广的覆盖范围、更短的重访周期和更少的访问限制。近年来,基于星载高光谱数据(如HJ-1A、珠海-1和GF-5/6卫星)在城市树种分类中的应用展现出良好的前景。
尽管高光谱数据能够捕捉丰富的光谱信息,但不同树种之间的光谱可分性仍存在限制。为了克服这一挑战,研究者们引入了时间信息,利用多时相遥感数据捕捉生长周期中的物候动态。例如,Nguyen等人(2024)应用了多时相深度学习框架,对瑞士阿尔卑斯山脉的森林进行映射,而Zhang等人(2025a)开发了基于时空熵的过滤器,以缓解分类结果中的年度变化。Liang等人(2025)进一步证明,将物候动态与高分辨率影像相结合可以提升分类精度,尽管仍然面临类别不平衡和同属树种可分性的问题。然而,使用完整的时间序列数据会导致数据维度大幅增加和计算成本上升,往往引发“维度灾难”问题。物候指标(如生长季开始、结束和持续时间)提供了一种更为紧凑且可解释的季节性变化表示方式。在此背景下,Xu等人(2025)展示了物候和极化特征结合在湿地植被分类中的应用,达到了93.51%的准确率,凸显了物候参数作为多时相信息有效代理的潜力。
为了充分挖掘多源特征,算法创新成为必要的研究方向。深度学习(DL)方法,尤其是卷积神经网络(CNN),由于其在光谱-空间特征提取方面的强大能力,成为遥感领域的主要技术手段。CNN方法已被成功应用于树种分类任务,包括在寒带森林中使用的3D-CNN、在城市绿化场景中使用的U-Net架构,以及用于大规模森林清查的ResNet变体。尽管这些方法取得了进展,但现有的模型往往难以在保持浅层空间细节与深层语义抽象之间取得平衡,且对类别不平衡和有限训练数据敏感。这些局限性突显了开发能够联合解决光谱相似性、类别不平衡和数据稀缺问题的架构的重要性。近期的研究已经开始弥合这一差距。Gevaert等人(2025)提出了一种结合Siamese网络与可解释AI的模型,仅需少量标注数据即可实现0.86的F1分数。Wu等人(2024)引入了FAST 3D-CNN P-Net,结合CNN带选择与少量样本原型网络,达到了98%以上的准确率,展示了轻量级少量样本模型在缓解光谱冗余和样本稀缺方面的潜力。这些研究表明,新兴的DL架构展现出广阔的前景,但也突显了在复杂森林环境中泛化、可解释性和鲁棒性方面的持续挑战。这些空白促使了新的框架的开发,以显式整合多源信息并采用先进的特征增强策略。
为此,我们提出了3D-M2C-ResNet,一种新的深度学习框架,结合了哨兵-2衍生的物候特征与珠海-1高光谱影像,用于精细尺度的城市森林树种分类。该框架引入了三个关键创新:(1) 3D-ResNet50主干网络,负责浅层和深层特征的初步提取;(2) 一种创新的3D MCDC模块,旨在提升多尺度上下文信息的表示能力;(3) CBAM模块,用于优化深层特征的表示。基于这些组件,我们开发了MFES,以应对网络深度增加时出现的浅层空间细节保留与深层语义抽象之间的固有权衡。通过实验评估,3D-M2C-ResNet在雄安新区的17种树种和地表覆盖类型分类任务中表现优异,整体准确率达到了98.08%,Kappa系数达到97.88%,显著优于其他基准方法。实验还通过消融和可视化实验量化了MCDC、MFES和CBAM模块的贡献。值得注意的是,引入物候信息显著提升了对光谱相似树种的分类性能,为精细化的城市森林地图绘制提供了有力支持。此外,数据和代码已公开发布,便于进一步研究和应用。
在雄安新区的研究区域中,高光谱数据采集的挑战在于如何在有限的资源下实现高效和准确的分类。为了确保训练样本的准确性,研究团队在2024年8月和10月进行了实地调查,收集了标注数据,并仔细验证了珠海-1高光谱影像,以确认地表覆盖类型没有发生变化。地理坐标通过RTK设备记录,同时获得了相应的树种信息。为了应对类别不平衡的问题,采用了数据增强和类别平衡的策略。数据增强方法包括随机水平和垂直翻转以及90度旋转,以引入不同冠层方向和局部上下文的变异性,而不改变中心像素及其邻域的光谱属性。光谱增强包括两种操作:(1) 在所有波段上添加高斯噪声(均值为0,标准差为0.01),以50%的概率进行,值被裁剪到[0, 1]以保持物理合理性;(2) 在光谱轴上进行±1–2波段的循环移位,以50%的概率进行,模拟由于传感器校准差异或大气效应引起的轻微光谱错位。在增强后,通过预定义的目标样本量对类别进行平衡,少数类样本数量不足目标值的通过增强数据补充,多数类样本数量超过目标值的则进行随机下采样。这种综合方法生成了一个平衡的训练数据集,增强了光谱-空间多样性,从而为3D-M2C-ResNet模型的稳定和无偏学习提供了支持。值得注意的是,数据增强和类别平衡仅应用于训练集,以提高少数类样本的表示,而验证和测试集保留了原始的类别不平衡分布,以确保模型评估能够反映真实世界的情况。
在方法论上,3D-M2C-ResNet模型通过融合多源数据和先进特征增强策略,实现了高效的树种分类。具体来说,该模型的架构包括三个核心模块:(1) 3D-ResNet50主干网络,用于初始提取浅层和深层特征;(2) MCDC模块,通过三分支设计扩展感受野,以捕捉多尺度的光谱和空间特征;(3) CBAM模块,用于优化深层特征表示。模型还引入了MFES策略,以平衡空间分辨率和语义丰富度,提供了一种新的3D特征提取方法。实验结果显示,3D-M2C-ResNet在雄安新区的分类任务中表现出色,整体准确率达到98.08%,Kappa系数达到97.88%,显著优于其他模型。对于某些光谱相似的树种,如PLOR、PIAR和SACH,该模型的召回率和F1分数均有所提升,表明其在复杂光谱环境中的分类能力。
从实际应用的角度来看,3D-M2C-ResNet模型在10米分辨率下生成了准确的树种级别地图,为城市林业管理提供了直接支持。在异质区域如Plot A中,该模型提供了更清晰的类别边界和更可靠的街道树木映射,有助于病虫害监测、植树设计和生物多样性评估。对于非植被地表覆盖类型,如建筑物、农田和水体,分类精度接近完美,使得在统一框架下同时映射植被和非植被类别成为可能。此外,树种级别的输出为使用物种特异性所有ometric方程进行生物量估计和碳汇评估提供了基础。通过减少针叶树种的误分类,该框架有助于避免碳汇模型中的偏差,增强基于森林的气候缓解策略的可靠性。
研究还探讨了不同模型配置对分类性能的影响,包括窗口大小和批量大小的设置。结果显示,23×23的窗口大小和128的批量大小在光谱-空间特征提取方面达到了最佳平衡,提高了分类精度并降低了损失。此外,通过消融实验,验证了MCDC和MFES模块的有效性。MCDC模块通过多尺度膨胀卷积捕捉了多尺度空间上下文信息,提升了模型对混合类高光谱像素的边界清晰度。MFES策略则通过自适应融合浅层和深层特征,增强了对小尺度对象的识别能力。CBAM模块虽然对模型性能的单独贡献较小,但在与MCDC模块结合后,显著提升了对碎片化或异质场景的特征区分能力。这些模块的组合在3D-M2C-ResNet中实现了显著的特征提取能力提升,特别是在高精度树种分类任务中。
此外,研究还分析了物候特征在高精度树种分类中的作用。实验结果显示,引入物候信息显著提升了分类精度,整体准确率从96.63%提升至98.08%,平均准确率从95.49%提升至96.56%,Kappa系数从95.70提升至97.88。这一提升归因于物候指标能够捕捉生长周期中的物种间差异,从而缓解单日高光谱数据中的光谱收敛问题。然而,物候信息的引入也带来了一些挑战,例如对于具有明显光谱特征但物候相似的树种(如ULPU和PIAR),类别边界变得模糊,导致分类能力下降。这些发现表明,未来的研究可能需要更精细的特征选择或自适应加权策略,以优化光谱和时间信息之间的平衡。
总体而言,3D-M2C-ResNet不仅在性能上优于现有基准模型,还通过解决长期存在的光谱相似性、类别不平衡和数据稀缺问题,推动了高光谱-多光谱融合技术的发展。同时,它在城市林业管理、生物多样性保护和生态系统碳核算方面具有重要的应用价值。展望未来,研究团队计划从三个方面推进进一步的工作:(1) 数据扩展,积极获取多模态遥感数据,如InSAR和LiDAR,以捕捉三维植被结构,进一步提升分类精度;(2) 模型优化,探索模型压缩技术(如知识蒸馏),以降低计算成本,同时保持分类精度;(3) 时间特征整合,计划将多时相高光谱影像与物候指标相结合,充分利用季节动态进行物种区分。通过这些努力,研究团队希望推动智能遥感技术向更高精度、更高效率和更强的实用性发展,为可持续森林管理、生物多样性保护和长期生态监测提供有力的技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号