
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于无人机影像的北方森林野火检测与烟雾分割数据集研究
【字体: 大 中 小 】 时间:2025年08月14日 来源:Scientific Data 6.9
编辑推荐:
本研究针对野火自动检测中开放数据匮乏的问题,由芬兰地理空间研究所等团队利用无人机(UAV)采集了北方森林环境下的野火影像数据,通过人工与计算机视觉基础模型(SAM)协同标注,构建了包含边界框标注、视频片段和分割掩模的三维数据集。该数据集成功应用于YOLO v5等模型的训练,显著提升了烟雾检测精度(mAP50-95达0.94),为基于深度学习的早期野火监测系统开发提供了关键数据支撑。
野火正以前所未有的频率威胁着全球生态系统,而传统监测手段难以应对烟雾的复杂光学特性——其可变透明度、与云层的相似性,以及北方森林特有的植被背景干扰,使得基于视觉的早期预警系统面临巨大挑战。更棘手的是,现有开放数据集如FLAME和HPWREN多聚焦火焰检测,缺乏针对烟雾的结构化标注,导致深度学习模型在真实场景中的泛化能力受限。
针对这一瓶颈,芬兰地理空间研究所(Finnish Geospatial Research Institute)联合多所高校的研究人员,在2022年夏季的4次受控燃烧实验中,利用DJI Phantom 4无人机采集了覆盖不同高度(10-200米)、视角(0°至-90°俯仰角)和光照条件的4K分辨率影像数据。

关键技术方法包括:1) 基于48帧间隔的视频抽帧策略确保数据多样性;2) 采用makesense.ai工具进行YOLO格式边界框标注;3) 利用SAM模型将边界框转化为像素级分割掩模;4) 通过PIDNet等模型验证数据效用性。所有数据均通过芬兰Fairdata平台开放共享。
【数据记录】
数据集按三类子集组织:Subset A包含芬兰四个地点(Evo、Heinola等)的4954张图像,采用"大范围"边界框策略(对比实验显示其检测精度较"小范围"提升290%);Subset B提供288段30秒视频片段,附带CSV格式的烟雾存在标签;Subset C则按训练集(1184图)、验证集(248图)、测试集(40图)划分,包含1080p分辨率下的二值掩模。

【技术验证】
在YOLO v5系列模型的基准测试中,使用本地数据微调的模型对Ruokolahti测试集的检测精度(mAP50-95)达0.94,而仅用HPWREN数据训练的模型精度骤降至0.03,证实北方森林环境需要专属数据集。分割任务中,基于SAM生成的掩模训练PIDNet模型,实现了9.7公里外烟雾的像素级识别,F1-score达0.754。

【对比分析】
如表1所示,相较于FLAME(火焰为主)、Furg-Fire(非野火场景)等6个公开数据集,本研究的独特价值在于:1) 首个专注北方森林烟雾检测的标注数据集;2) 同时提供边界框、视频分类和分割标签;3) 包含无人机多视角原始数据。这种多维度的数据架构支持从分类到像素级分析的全流程研究。
这项发表于《Scientific Data》的研究,通过严谨的技术验证和跨数据集对比,确立了北方森林环境对专属训练数据的依赖性。其创新性地将基础视觉模型(SAM)引入标注流程,既保障了数据规模(4954张图像),又通过40张人工精标测试集确保了质量可控。该数据集不仅填补了烟雾检测领域的数据空白,其提供的坐标转换公式和Jupyter Notebook工具链,更为后续研究提供了"开箱即用"的技术支持。随着气候变化加剧野火风险,这类地理特异性数据将成为构建下一代智能监测系统的基石。
生物通微信公众号
知名企业招聘