《Applied Computing and Geosciences》:Convolutional neural networks for wildfire spread and intensity prediction
编辑推荐:
野火对生态系统、人类健康、基础设施及气候具有显著影响,因此,准确预测火行为及其影响具有关键意义。传统基于物理的模型能够细致模拟火灾—大气相互作用,但计算代价高昂,且在实时应用中存在局限。此外,输入参数的不确定性以及对燃烧过程的简化表征,可能降低其对野火驱动排放
野火对生态系统、人类健康、基础设施及气候具有显著影响,因此,准确预测火行为及其影响具有关键意义。传统基于物理的模型能够细致模拟火灾—大气相互作用,但计算代价高昂,且在实时应用中存在局限。此外,输入参数的不确定性以及对燃烧过程的简化表征,可能降低其对野火驱动排放与烟羽动力学预报的可靠性。另一方面,经验模型与统计模型虽然计算效率较高,但往往缺乏捕捉驱动野火蔓延的非线性与耦合过程的能力。
本研究提出一种基于卷积神经网络(CNN)的深度学习方法,用于在不同风场、燃料和大气稳定度环境条件下预测野火动力学。该模型基于高分辨率天气研究与预报模型(WRF)耦合SFIRE模块(WRF-SFIRE)模拟数据集进行训练,并通过地表热通量(GHF)场表征火灾强度与推进过程,从而预测野火蔓延的时间演化。模型性能采用均方根误差(RMSE)14.3 kW/m2、平均绝对误差(MAE)6.6 kW/m2、相关系数(R2)84%,以及结构—振幅—位置(SAL)方法进行空间检验。
结果表明,该CNN能够有效再现野火动力学的空间与时间演化,并在多种条件下与参考模拟结果保持高度一致。该方法能够以显著更低的计算成本准确捕捉火灾蔓延与强度模式,显示出深度学习可作为现有火灾建模框架的重要补充,并可支持更快速、可扩展的野火行为预报。
该论文发表于《Applied Computing and Geosciences》,研究聚焦于利用深度学习方法实现野火蔓延与强度的快速预测。研究背景在于,野火过程同时受风场、燃料性质和大气稳定度共同控制,并与近地层大气发生强烈双向耦合,因此传统野火模拟通常依赖火灾—大气耦合的基于物理模型。这类模型虽然能够解析流体动力学、燃烧和热力反馈过程,但计算量极高,难以满足大范围火情实时预测和业务化应用需求。同时,经验模型和统计模型虽具有较高效率,却难以表达火线推进过程中突出的非线性、多尺度和耦合反馈机制。正是在这一背景下,研究人员尝试引入卷积神经网络(CNN,擅长处理网格化空间数据的深度学习模型),以构建可替代部分高成本数值模拟的代理模型(surrogate model),服务于野火快速预报。论文的核心目标是:从高分辨率WRF-SFIRE耦合模拟中学习气象条件、燃料特征与火灾行为之间的复杂关系,并用地表热通量(GHF,ground heat flux,地表层火热释放强度指标)刻画火灾强度与蔓延过程,进而实现野火时空演化预测。
为开展该研究,研究人员使用了Moisseeva and Stull构建的合成野火烟羽数据集子集,数据来源于WRF-SFIRE数值模拟。研究最终选取105个火线长度为2 km、模式顶高度为3000 m的同质化情景,以保证样本可比性。方法上主要包括:构建基于多通道输入的CNN模型,将6类三维气象变量按15个垂直层映射为通道,并联合燃料载量、大气稳定度剖面斜率及当前时刻GHF作为输入;采用多尺度卷积核(3×3、5×5、7×7)提取空间特征;以均方误差(MSE)为损失函数,使用Adam优化器训练;并通过RMSE、MAE、R
2及SAL(Structure-Amplitude-Location,结构—振幅—位置)方法评估模型在燃烧区的预测性能。
在研究设计上,论文首先对数据集进行了筛选与预处理。原始数据由147个NetCDF情景组成,每个情景对应不同的环境风速、燃料类型、大气稳定度和火线长度。为降低异质性,研究仅保留了105个以2 km火线长度为主的模拟案例。每个样本包含风速三个分量、气温、气压、水汽混合比等三维气象场,以及燃料类型、稳定度和GHF等火灾相关变量。考虑到完整三维空间维度过高,研究人员截取了包含活动火区的子区域,并保留最靠近地表的15个垂直层,以集中表征主要火灾—大气耦合过程。在特征构建中,研究将时刻t的气象与火灾变量用于预测时刻t+1的GHF,因此模型属于单步预测框架,而非自回归系统。值得注意的是,当前时刻的GHF也被作为输入通道显式引入,以帮助模型识别火前沿位置与当前火强分布。
在模型结构方面,论文提出的是多核卷积CNN。模型由5个连续的ConcatConvBlock构成,每个模块并行采用3×3、5×5和7×7卷积核,以同时捕获细尺度火前沿梯度与较大尺度热场结构;之后通过拼接通道和最大池化逐步压缩空间维度并增强表征能力。卷积特征最终经展平后输入三层全连接网络,输出重塑为250×500的二维GHF场。该结构借鉴多尺度卷积设计思想,强调对不同空间尺度火行为模式的同步提取。训练中,研究人员对学习率、权重衰减、批量大小、dropout率、优化器、池化方式和损失函数进行了系统调参,最终确定Adam优化器、学习率5×10
?5、权重衰减10
?5、批量大小64、dropout为0.3、最大池化和ReLU激活函数的最优配置。
**3.1. Model training and validation performance**
该部分主要说明模型训练收敛性、计算效率和结构合理性。训练曲线显示,模型在训练集和验证集上均平稳收敛,至第195个epoch达到最低验证损失,未见显著过拟合。与WRF-SFIRE依赖逐时步数值积分不同,CNN在离线训练完成后,仅需一次前向传播即可生成某一时刻的GHF预测,因此推理速度显著提升。测试阶段在NVIDIA GPU上处理1659个样本共耗时48 s,平均每样本29 ms,吞吐量为34样本/s,说明该代理模型在时效性上具有明显优势。论文进一步比较了多种损失函数,结果表明标准MSE在RMSE、MAE与R
2方面综合表现最佳。随后通过消融实验评估架构关键组成:适度dropout(0.3)可在偏差—方差之间取得最佳平衡;单一卷积核结构性能低于多卷积核组合;缩减网络宽度也会降低预测精度。这些结果支持多尺度卷积和适中正则化对于复杂野火热通量预测是必要的。
**3.2. Quantitative evaluation**
该部分使用定量指标检验模型在测试集燃烧区的预测能力。结果显示,模型在非零GHF网格上的RMSE为14.3 kW/m
2,MAE为6.6 kW/m
2,R
2为0.84,表明模型对活动火区地表热通量具有较强解释能力。时间序列误差分析表明,若将大量非燃烧背景网格计入统计,误差会被显著稀释;若仅考虑燃烧区,则在野火早期误差较大,随后随着火场扩大和热通量结构更稳定,误差趋于平稳。密度散点图表明,大部分预测值沿理想对角线分布,说明整体一致性良好,但模型在中高GHF区间存在低估倾向,尤其对大于175 kW/m
2的高强度事件表现出更明显的峰值低估。误差直方图进一步显示误差主要集中在零附近,但整体略向负值偏移,再次说明模型存在轻微系统性低估。
**3.3. Visual assessment: Comparison of the ground heat flux contours**
该部分通过不同情景和不同时次的二维GHF等值线图,对模型的空间结构再现能力进行直观检验。研究比较了实际WRF-SFIRE输出与CNN预测结果,并展示二者差值场。结果表明,在高风速、高燃料载量条件下,模型较好再现了近抛物线形态的火场范围和强度分布;在低燃料载量、蔓延较弱的情景中,模型虽能把握火形与有限扩展范围,但对火强存在更明显低估;在较易燃燃料与有利环境共同作用下,模型同样能够较好刻画火前沿空间范围和整体热释放。多个情景共同显示,模型对火线两侧和已燃区局部区域有时出现高估,而在推进中的火前沿峰值位置则更常见低估。论文据此指出,预测偏差主要表现为火前沿峰值热通量不足和预测场较平滑。
针对上述偏差,论文进一步从两方面进行解释。其一是数据不平衡:极端高GHF值仅出现在较小空间范围和较短时间窗口内,而训练数据大部分区域由低至中等热通量主导,因此模型对极端峰值样本学习不足。其二是架构平滑效应:卷积、池化等操作天然会削弱局地尖峰梯度,使火前沿高值被“抹平”。论文通过损失函数比较和消融实验指出,这两种机制共同导致峰值低估,但多尺度卷积结构已经在一定程度上缓解了空间过平滑问题,因此未来改进重点更应放在缓解高强度样本不足上。
**3.4. SAL score distribution**
该部分使用SAL(结构—振幅—位置)方法对二维空间场进行更具物理解释性的检验。SAL将预测误差分解为结构误差(S)、振幅误差(A)和位置误差(L)。结果显示,在多数情景中,SAL点随时间推进逐渐向原点收敛,说明随着野火发展,模型对GHF的结构、幅度和空间位置预测均逐步改善。早期阶段由于强热通量区域较小且稀疏,SAL对位置偏移更敏感,因此误差较大;而在后期火区扩大后,模型在结构与位置上拟合更稳定。对于低强度弱火情景,散点分布较分散,表明结构与振幅误差波动更大,但位置预测仍保持较好一致性。总体而言,SAL分析支持该模型在火场后期和关键影响阶段具有较可靠的空间预测能力。
论文讨论部分强调,该研究证明了CNN作为野火动力学代理模型的可行性与应用潜力。相较传统WRF-SFIRE模拟,CNN在维持较好时空预测能力的同时,显著降低了计算成本,适合用于快速预报和决策支持。然而,研究人员也明确指出了若干局限性。首先,所用数据集仅包含火线长度为2 km、模式顶高度为3000 m的同质化子集,这限制了模型对不同点火尺度、火线几何和垂直域配置情景的泛化能力。其次,数据划分基于时间步而非完整模拟个例,可能导致同一火情序列相邻时间样本被分配至训练集和测试集,从而带来时间泄漏风险。再次,以位温廓线斜率表征垂直稳定度虽具有实用性,但对复杂层结结构有所简化,也会引入不确定性。论文据此提出,未来应扩大训练集覆盖范围,增强极端火前沿样本表征,采用按模拟个例划分数据集的方法,并探索更先进的损失函数、编码器—解码器结构以及物理约束神经网络(physics-informed neural network)设计,以提高尖峰预测与模型泛化能力。
研究结论部分可译为:本研究开发并评估了一种用于野火模拟中地表热通量(GHF)预测的卷积神经网络(CNN)模型,输入为气象与燃料数据。该模型采用基于ConcatConvBlock的多尺度特征提取结构,并结合全连接层,从而能够提取对火灾蔓延预测至关重要的细尺度与粗尺度空间模式。训练与验证结果表明,该CNN模型具有较强预测性能,在测试数据集上达到RMSE 14.3 kW/m
2、MAE 6.6 kW/m
2、R
2为0.84。进一步的二维等值线定性分析显示,CNN能够较准确再现不同环境情景下野火蔓延的强度和空间结构。SAL分析则表明,大多数预测在结构、振幅和位置上均与WRF-SFIRE输出高度一致,且随着野火发展,预测结果逐步收敛至更准确的火场表征。尽管如此,在低燃料载量和弱火行为情景下,模型对火强预测存在一定偏差;此外,普遍存在A<0的现象,表明火前沿强度持续被低估。该偏差主要与极端GHF样本不足及卷积网络平滑效应有关。总体而言,本研究表明,以CNN为代表的深度学习方法有潜力作为WRF-SFIRE等传统数值模拟的重要补充,为野火动力学预测提供一种更快速且计算高效的替代方案,并支持面向野火管理的实时决策工具开发。