结合树增强与混合效应模型提升遥感森林年龄预测性能

《Forestry: An International Journal of Forest Research》:Combining tree-boosting and mixed effects models improves the performance of remote-sensing based forest age predictions

【字体: 时间:2025年12月12日 来源:Forestry: An International Journal of Forest Research 3.0

编辑推荐:

  本研究针对遥感数据预测森林年龄的难题,创新性地结合机载激光扫描(ALS)与Sentinel-2数据,通过线性混合效应(LME)模型与树增强混合效应(GPBoost)模型的对比分析,发现引入表征立地条件的分类变量(如主林型)可显著降低预测误差(GPBoost模型相对均方根误差从41.7%降至38.5%),而先验识别含保留木地块的策略进一步将误差优化至36.3%。该研究为老龄林(≥150年)的精准识别提供了新方法,对森林管理与生物多样性保护具有重要意义。

  
森林年龄是评估森林生态系统功能、制定可持续经营策略及保护生物多样性的关键参数。然而,在广袤的 boreal(寒温带)管理森林中,获取精确的森林年龄信息却面临巨大挑战。传统的树木年轮钻取法不仅耗时费力,且常受土地所有者许可限制;而依赖经验的航空照片判读则存在主观性强、难以大范围应用的弊端。尤其令人困扰的是,当森林步入成熟期后(例如超过100-120年),其树高生长趋于停滞,导致基于遥感数据(如反映冠层高度的机载激光扫描ALS指标)的年龄预测准确性急剧下降。这使得准确识别具有高保护价值的老龄林(old-growth forests)变得异常困难,而这类森林恰恰是众多濒危物种的关键栖息地,并储存着大量的碳。因此,开发一种能够高效、准确预测大范围森林年龄,特别是能有效区分老龄林的技术方法,成为了森林遥感领域一个亟待突破的瓶颈。
为了解决这一难题,由芬兰自然资源研究所(Luke)和东芬兰大学的研究人员Janne Toivonen领衔的研究团队,在芬兰北部的广袤 boreal 森林区域开展了一项创新性研究。他们综合利用了机载激光扫描(ALS)提供的三维结构信息、Sentinel-2卫星影像的光谱数据,以及来源于芬兰国家森林调查(NFI)、可覆盖整个景观的分类变量(如主要立地类型MainType、木材生产限制WoodProdRestr等),对870个NFI样地(年龄范围0-300年)的森林年龄进行了精细预测。该研究首次在森林遥感领域引入并比较了线性混合效应(LME)模型和树增强混合效应(GPBoost)模型这两种方法的性能。研究成果发表在专业期刊《Forestry: An International Journal of Forest Research》上,为提升森林年龄遥感预测的精度和实用性提供了新的思路和解决方案。
为开展本研究,研究人员主要应用了几项关键技术方法:首先,利用芬兰国家土地调查局组织的KALLIO项目获取的机载激光扫描(ALS)点云数据(点密度5.1-9.5点/平方米)和通过Google Earth Engine(GEE)平台生成的Sentinel-2卫星影像夏季镶嵌图,提取了样地级别的多种特征指标,包括ALS高度、密度、冠层覆盖度等指标以及Sentinel-2各波段值、波段比值和植被指数(如NDVI)。其次,研究整合了来自NFI的景观级分类变量(ALS数据区块、主林型、木材生产限制)。第三,研究采用了10折交叉验证重复50次的稳健验证策略,评估了三种建模方案(SC1:仅遥感特征;SC2:遥感特征+分类变量作为随机效应;SC3:SC2基础上增加保留木地块先验分类)下LME和GPBoost模型的预测性能,以相对均方根误差(%RMSE)和相对偏差(%BIAS)作为主要评价指标。最后,利用最佳性能模型(GPBoost结合SC3策略)生成了研究区内森林年龄的连续分布图。
预测场景与方法比较
研究人员设计了三种渐进的预测场景(SC1, SC2, SC3)来系统评估不同因素对模型性能的影响。SC1仅使用ALS和Sentinel-2的遥感特征;SC2在SC1基础上加入了分类变量作为随机效应;SC3则在SC2的基础上,增加了一个前置步骤——使用逻辑回归模型识别出含有保留木的样地(hold-over plots),然后对保留木样地和其他样地分别建立年龄预测模型。结果表明,无论在哪种场景下,GPBoost模型的预测性能均优于传统的LME模型。引入分类变量(SC2)使得预测误差显著降低,LME模型的相对RMSE从46.2%降至40.2%,GPBoost模型从41.7%降至38.5%。而结合了保留木地块分类的SC3策略进一步优化了结果,将LME和GPBoost的相对RMSE分别降至约38.2%和36.3%。特别值得注意的是,SC3策略显著改善了对观测年龄接近零的样地的预测效果。
分类变量作为随机效应的贡献
分析SC3场景中“其他样地”模型的随机效应发现,分类变量对年龄预测有重要影响。例如,与无限制林地相比,“受保护森林”这一类别使LME模型预测的年龄增加了约30年,GPBoost模型增加了约40年。“未排水泥炭地”也使预测年龄显著增加。这表明立地条件信息极大地帮助模型修正了预测值,使其更接近真实年龄。ALS数据区块作为随机效应的变异很小,说明不同传感器和采集设置对年龄预测的整体影响不大。
关键预测变量识别
对于年龄预测,ALS指标被证明比Sentinel-2指标更为重要。在GPBoost模型的SC3策略中,对于“其他样地”,最大植被高度是最重要的预测变量。对于“保留木样地”,Sentinel-2的B3波段(绿光波段)重要性显著上升,而最大高度的重要性下降,这反映了保留木样地中年龄由幼苗决定、冠层结构特殊的实际情况。在保留木样地的分类模型中,主林型(MainType)、Sentinel-2的B11波段(短波红外)及其与B8A波段的比值(湿度胁迫指数)以及ALS高度分布的60%分位箱线图(b60)是重要的区分指标。
森林年龄分布图生成
作为方法应用示范,研究人员利用表现最佳的GPBoost模型(SC3策略)为Huttutunturi区域生成了森林年龄连续分布图。该图清晰地显示了管理森林与位于国家公园内的森林之间的年龄差异,国家公园内的森林普遍预测年龄更大,验证了该方法在景观尺度上识别潜在老龄林区域的可行性。
本研究通过系统性的比较分析,得出了明确结论:树增强混合效应模型(GPBoost)在利用遥感数据预测森林年龄方面,性能显著优于传统的线性混合效应模型(LME)。将表征立地条件的分类变量以随机效应的形式纳入模型,能有效捕捉不同土地类型和管理限制下的年龄变异,从而显著提升预测精度,特别是对于老龄林的识别能力。研究还证实,在年龄预测前先对结构特殊的保留木样地进行分类并分别建模,是进一步降低整体预测误差的有效策略。
该研究的成功实施具有多重重要意义。首先,它为解决长期困扰遥感领域的“老龄林预测难”问题提供了切实可行的技术方案,使得大范围、高精度地绘制森林年龄分布图成为可能,这对于执行如欧盟2030生物多样性战略中保护所有原始林和老龄林的目标至关重要。其次,研究所倡导的GPBoost模型框架,巧妙地将机器学习捕捉复杂非线性关系的能力与混合效应模型处理层次结构数据的优势相结合,为森林遥感乃至其他生态学领域的参数反演提供了新的方法论借鉴。最后,生成的森林年龄连续分布图可直接服务于森林资源管理、碳储量估算、生物多样性保护规划等多种应用场景,具有很高的实用价值。尽管在保留木样地等特殊情况下预测仍存在挑战,但本研究无疑将森林年龄的遥感预测水平提升到了一个新的高度,为森林生态系统的可持续管理提供了强有力的科学工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号