集成遥感和气象数据的LSTM神经网络揭示了过去100年中国森林火灾风险的变化轨迹
《Agricultural and Forest Meteorology》:LSTM neural network integrating remote sensing and meteorological data reveals forest fire risk trajectories in China over the past 100 years
【字体:
大
中
小
】
时间:2025年10月10日
来源:Agricultural and Forest Meteorology 5.7
编辑推荐:
森林火灾风险动态评估与历史重建研究。基于气象站观测数据、地形特征优化森林火灾危险指数(MFFDI),结合LSTM深度学习模型预测1921-1960年历史风险值,并利用ANUSPLIN空间插值方法生成全国风险分布图。验证表明模型预测精度高(R2=0.77,MSE=0.24),揭示近百年高风险区分布规律(西南/西北/北部占比19%-26%),1980年后向中部/西南部集中,中风险区东南迁移。研究为森林防火长期策略制定提供数据支撑。
森林火灾是影响生态系统稳定性和人类社会安全的重要自然现象。随着全球气候变化和人类活动的加剧,森林火灾的发生频率和强度呈现出复杂的变化趋势。为了更有效地进行森林火灾防控,科学地评估和预测森林火灾风险显得尤为重要。特别是在中国,由于地理环境的多样性以及历史数据的不完整性,构建长期的森林火灾风险评估体系具有挑战性。因此,本研究提出了一种基于深度学习和空间插值方法的回顾性森林火灾风险建模策略,旨在解决传统方法在长期预测中的局限性,并为森林火灾防控提供科学依据。
森林生态系统在地球生态系统中占据着不可替代的位置。它们不仅为生物多样性提供了重要的栖息地,还在碳循环、水循环、土壤保护和气候调节等方面发挥着关键作用。通过光合作用,森林能够吸收二氧化碳并释放氧气,使其成为地球上最大的碳汇之一,对缓解气候变化具有重要意义。然而,森林火灾作为一种毁灭性的自然灾害,对森林生态系统的完整性以及人类社会的安全构成严重威胁。火灾不仅会导致森林资源的大量损失,还可能引发一系列次生灾害,如生物栖息地的破坏、生物量的燃烧、空气污染、土壤退化以及水资源的污染。特别是在短期内,火灾可能释放出大量碳排放,加速全球变暖的进程。因此,准确预测森林火灾风险,并据此制定有效的预防措施,已成为当前环境治理中的紧迫任务。
传统的森林火灾风险评估方法主要依赖于地面观测、气象数据分析以及历史火灾记录。这些方法通过分析温度、湿度、植被可燃性、风速等气象要素,结合地面调查与历史火灾数据,对火灾风险进行评估和预警。然而,这些方法在应用过程中存在明显的局限性,尤其是在大面积森林区域的监测方面。由于需要实时获取单个观测点的地面数据,传统的评估方法难以实现对难以到达地区的全覆盖监测,这在实际应用中存在较大的困难。相比之下,遥感技术在森林火灾风险评估中展现出显著的优势。通过卫星或航空传感器获取连续的地表信息,遥感技术能够实现对大面积森林区域的近实时监测,并具备较高的空间和时间分辨率。此外,对遥感图像的分析可以提取地表温度、植被覆盖变化和火灾痕迹等信息,从而对火灾风险进行更全面的评估。这种技术手段显然能够克服传统方法的不足。
然而,利用遥感数据重建长期的森林火灾历史仍然存在一定的挑战,尤其是在卫星数据尚未覆盖的历史时期。为了弥补这一缺陷,一些研究者尝试通过分析环境中保存的燃烧残留物,如树轮中的火灾痕迹、沉积物中的炭黑和黑碳沉积物等,来推断火灾历史(Masiello, 2004; Swetnam, 1993)。尽管这些环境代理变量在某些情况下提供了有用的信息,但它们在空间分布上存在局限性,收集成本较高,且容易受到外部干扰的影响,因此难以准确描绘火灾的空间分布特征。即便如此,重建卫星数据覆盖之前的森林火灾模式仍然是可行的。通过编制森林火灾风险地图,可以识别潜在的火灾高发区域及其风险等级,从而为区域性的火灾预防和管理提供重要依据(Chuvieco and Congalton, 1989)。
目前,许多关于森林火灾风险预测的研究已经基于简单的统计和经验方法展开,例如层次分析法(Akay and ?ahin, 2019)、证据权重法(Amatulli et al., 2007)、多元线性回归(Oliveira et al., 2012)以及重要性抽样法(Waeselynck and Saah, 2024)。然而,森林火灾行为是一种典型的非线性和复杂过程,受到多种因素的交互影响。为应对这一挑战,越来越多的研究者开始采用机器学习方法,如随机森林(RF)、支持向量机(SVM)、逻辑回归、XGBoost、神经网络和贝叶斯网络等,用于森林火灾风险预测模型的构建(Buch et al., 2023; Michael et al., 2021; Milanovi? et al., 2020; Sevinc et al., 2020; Sevin?, 2023; Storey et al., 2021)。例如,Milanovi? et al.(2020)利用逻辑回归和RF模型对东塞尔维亚的森林火灾概率进行了映射,而Michael et al.(2021)则结合三种算法(逻辑回归、RF和XGBoost)并利用植被状况数据,对希腊的森林火灾风险进行了预测。此外,Buch et al.(2023)采用一种随机机器学习模型,预测了美国西部地区火灾频率和规模的概率分布,为理解大规模火灾活动的统计特征提供了新的视角。尽管这些方法在短期预测中表现出较强的鲁棒性,但在捕捉长期风险演变和时空变化方面仍存在一定的局限性,主要由于火灾驱动因素的时间模式不稳定,以及多种因素之间的复杂相互作用。
为了克服这些限制,近年来基于长期时间序列数据的深度学习方法受到了越来越多的关注,尤其是通过长短期记忆网络(LSTM)模型的应用。LSTM作为一种专门处理时间序列数据的神经网络架构,能够自动提取复杂数据中的特征,并有效捕捉长期依赖关系和动态变化模式(Bharadiya, 2023; Shih et al., 2019)。例如,Peng et al.(2024)系统地比较了自回归积分滑动平均(ARIMA)、Prophet和LSTM模型在预测中国四川省森林火灾风险中的表现。结果表明,LSTM模型在预测精度方面优于ARIMA和Prophet模型。因此,结合历史气象数据和LSTM模型在森林火灾风险预测中展现出独特的优势,能够成为长期森林火灾风险预测的强大工具。然而,该研究也面临两个额外的问题:首先,采用的单步预测方法限制了模型在捕捉长期趋势和复杂时间序列模式方面的能力;其次,尽管模型参数在不同气象站之间进行了单独调整,但整个过程仍然依赖于研究人员的经验和判断,这可能导致模型在不同站点之间的表现不均衡,从而影响整体预测的准确性。
森林火灾风险评估不仅依赖于气象数据,还受到地形特征如坡度和坡向的影响。坡度与森林火灾发生风险之间的关系呈现非线性特征,根据多项研究(Peng et al., 2024; Rogeau and Armstrong, 2017; An et al., 2022),当坡度接近20°时,火灾风险达到峰值。此外,不同坡向对植被接收到的阳光时长和强度具有不同影响,进而导致温度、湿度、土壤和植被条件的差异(Courtney Mustaphi and Pisaric, 2013; An et al., 2022)。总体而言,南坡的火灾发生概率较高,并且在点火后火势蔓延速度更快(Dupuy and Maréchal, 2011)。因此,将地形因素纳入森林火灾危险指数(FFDI)中,构建一个改进的指数(即修改后的FFDI,MFFDI),有助于提高森林火灾风险预测的精度。
传统的FFDI评估方法依赖于单个气象站的观测数据,因此需要通过空间插值技术将其扩展到区域尺度,以实现对森林火灾发生风险的像素级估计(Bharadiya, 2023; Shih et al., 2019)。Kriging插值方法因其简单性和较高的插值精度而被广泛采用。然而,这种方法仅基于插值数据本身进行空间插值,忽略了其他可能提升插值精度的辅助信息(Li and Heap, 2014; Ly et al., 2013)。此外,Kriging方法要求插值数据的残差服从正态分布,但许多空间变量难以严格满足这一假设,因此其适用性在实践中往往受到限制(Lam, 1983; Oliver and Webster, 1990)。为了解决这些问题,Hutchinson(1995)开发了ANUSPLIN插值方法,该方法专门用于插值气象数据,并基于薄板样条理论构建。与传统的Kriging方法不同,ANUSPLIN可以在空间插值过程中引入海拔作为协变量,从而提高插值的准确性(Price et al., 2000)。大量研究表明,ANUSPLIN在所有时间尺度上都比Kriging和逆距离权重等方法更准确和更平滑,特别是在复杂地形区域中表现出更强的适用性(Ren-ping et al., 2016; Yener, 2023; Fu et al., 2023)。
在过去的一个世纪中,中国的森林资源经历了显著的变化,这主要归因于多种自然过程和人为干预。随着人口增长和经济发展,森林面积曾一度大幅减少。然而,近年来,中国政府加大了对森林资源的保护力度,特别是通过大规模的植树造林和防护林工程,使得森林覆盖率逐渐回升(Fu et al., 2023)。尽管如此,森林火灾仍然是威胁森林资源的重要因素。历史上,中国的森林火灾情况呈现出明显的波动,尤其是在干旱季节和频繁出现极端天气事件的年份,火灾风险显著增加(Ying et al., 2018)。一些研究已经对中国的某些地区进行了森林火灾分析,例如Dong et al.(2005)利用遥感和GIS技术,对白河林业局的森林火灾风险区域进行了划分;Tan和Feng(2023)则基于2010年至2018年的卫星数据,使用RF模型预测了湖南省的森林火灾发生情况;Pan et al.(2016)利用MODIS遥感数据和GIS技术,对山西省的森林火灾风险地图进行了构建。然而,这些研究大多局限于特定区域和较短的时间范围,难以全面反映全国范围内的森林火灾动态变化。因此,本研究提出了一种新的方法,通过结合修改后的FFDI(MFFDI)、LSTM模型和空间插值技术,构建了一个涵盖过去100年的中国森林火灾风险数据库。该方法旨在提高对不同地区森林火灾风险变化的评估精度,从而为未来的森林资源管理和火灾防控工作提供科学依据。
本研究的研究区域涵盖了中国大陆,不包括台湾地区,因为该地区缺乏可靠的历史数据。中国位于东亚,地理范围从北纬18°到54°,东经73°到135°,地形多样,包括高原、山脉、盆地和平原等,呈现出显著的地理差异。其中,西南地区拥有世界最高的高原——青藏高原,而西藏境内的珠穆朗玛峰则高达8848米(Wang et al., 2017)。此外,中国还拥有众多重要的河流,这些河流不仅影响区域的气候条件,也对森林火灾的发生和传播产生重要影响。由于中国幅员辽阔,地形复杂,森林火灾风险在不同区域呈现出不同的特征。因此,构建一个涵盖全国范围的森林火灾风险评估体系,对于制定科学有效的火灾防控策略至关重要。
本研究的方法主要包括四个主要步骤(见图2)。第一步是对历史气象数据进行筛选,并通过空间插值技术获得具有更长覆盖时间的站点数据。第二步是基于筛选后的站点数据,引入坡度和坡向因素,对原始FFDI进行修改,以增强其在不同站点之间对潜在森林火灾发生风险的描述能力,并在此基础上构建历史MFFDI数据。第三步是利用LSTM深度学习框架,建立一个能够实现多步预测的模型,以回溯1921年至1960年的MFFDI数据。第四步是通过空间插值方法,将预测得到的MFFDI数据转化为森林火灾风险分布图,从而实现对全国范围内森林火灾风险的可视化呈现。该方法通过综合考虑气象数据、地形因素和深度学习技术,能够更全面地描绘森林火灾风险的时空演变特征,为长期森林火灾风险预测提供新的思路。
在模型构建过程中,LSTM网络被设计为一个七层的深度神经网络模型(见图4)。该模型包括一个输入层、两个LSTM层、一个密集层和一个输出层。在每个LSTM层之后,都添加了一个Dropout层,以减少模型过拟合的风险。输入数据为1961年至2020年的MFFDI时间序列数据,而模型的输出则是回溯至1921年至1960年的月度MFFDI数据。通过这种多步预测机制,LSTM模型能够更准确地捕捉MFFDI在不同时间尺度上的变化趋势,从而提高森林火灾风险预测的精度。此外,该模型在不同气象站之间进行了参数的独立优化,以确保预测结果在空间上的稳定性。然而,由于历史数据的不完整性和不一致性,模型在不同区域的预测性能可能存在一定的差异,这需要在实际应用中进行进一步的验证和调整。
在对MFFDI在不同气象站之间描绘火灾风险比较模式的有效性进行评估时,研究发现,MFFDI在卫星数据尚未覆盖的历史时期,为森林火灾风险预测提供了重要的理论基础。然而,一些研究者指出,除了气象因素外,地形特征如坡度和坡向也会对森林火灾的发生产生显著影响(Courtney Mustaphi and Pisaric, 2013; Peng et al., 2024; An et al., 2022)。地形因素通过影响太阳辐射、风向和燃料湿度等条件,进而改变火灾的行为和蔓延速度(Millikin et al.)。因此,将这些地形因素纳入MFFDI的构建过程中,有助于提高模型对森林火灾风险的预测能力。
为了实现对全国范围的森林火灾风险评估,本研究采用了ANUSPLIN插值方法,以弥补传统Kriging方法在空间插值方面的不足。ANUSPLIN插值方法在空间插值过程中引入了海拔作为协变量,从而提高了插值的准确性(Price et al., 2000)。此外,该方法在不同时间尺度上的表现优于其他插值技术,特别是在复杂地形区域中具有更强的适用性(Ren-ping et al., 2016; Yener, 2023; Fu et al., 2023)。通过结合MFFDI和ANUSPLIN插值方法,本研究能够更准确地描绘中国过去100年间的森林火灾风险分布特征,为森林火灾防控提供科学依据。
研究结果表明,模型预测的1921年至1960年的MFFDI数据在独立验证子集中表现出较高的准确性,平均R2值为0.77,平均均方误差(MSE)为0.24。这表明模型在长期预测方面具有较强的能力。在对模型生成的森林火灾风险地图进行独立验证时,发现193起历史火灾事件发生在高或相对高风险区域,而72起发生在中等风险区域。空间分析进一步揭示了过去100年间,中国高和相对高风险区域主要分布在西南、西北和北方地区,占总森林火灾风险面积的19%至26%。然而,自1980年以来,高和相对高风险区域逐渐集中于中南部和西南地区,而中等风险区域则从西南向东南迁移。高风险区域的面积始终保持在8%以下,显示出一定的稳定性。这些结果表明,中国森林火灾风险的时空演变呈现出明显的区域差异,而这些差异可能受到气候条件、地形特征和人类活动等多重因素的影响。
本研究通过结合深度学习、气象数据和空间插值方法,构建了一个能够反映中国过去100年森林火灾风险变化的模型。该模型不仅能够准确预测不同区域的火灾风险水平,还能揭示火灾风险在时间和空间上的演变规律。通过分析历史火灾事件的分布情况,研究发现,高风险区域的集中分布可能与特定的气候条件和地形特征密切相关。例如,西南地区的高海拔地形和干燥气候可能使其成为森林火灾的高发区域,而随着经济发展和森林保护措施的实施,中等风险区域的迁移趋势可能反映了人类活动对森林火灾风险的调控作用。这些发现对于制定科学的森林火灾防控策略具有重要意义,因为它们能够帮助决策者识别高风险区域,并采取相应的预防和应对措施。
此外,本研究还强调了构建长期森林火灾风险数据库的重要性。通过整合历史气象数据、地形信息和深度学习模型,该数据库能够提供更全面的火灾风险信息,从而支持更精确的火灾预测和风险评估。这一方法不仅能够弥补传统方法在长期预测中的不足,还能为未来森林火灾的防控提供科学依据。研究结果表明,利用MFFDI和空间插值技术,可以更准确地描绘森林火灾风险的时空分布特征,为制定区域性的火灾管理政策提供重要参考。同时,该方法也为进一步研究森林火灾与气候变化、土地利用变化等其他因素之间的关系奠定了基础。
总之,本研究通过引入深度学习技术,结合历史气象数据和空间插值方法,构建了一个能够反映中国过去100年森林火灾风险变化的模型。该模型不仅提高了对森林火灾风险的预测精度,还揭示了火灾风险在时间和空间上的演变规律。通过分析不同区域的火灾风险分布,研究为森林火灾防控提供了科学依据,并为未来的森林资源管理提供了新的思路。此外,本研究还强调了构建长期森林火灾风险数据库的重要性,以支持更全面的火灾预测和风险评估。这些成果对于提升中国森林火灾防控能力,保护森林生态系统和促进可持续发展具有重要意义。