
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向嵌入式前端的轻量化深度学习火灾检测硬件加速器IP核设计与实现
【字体: 大 中 小 】 时间:2025年09月24日 来源:Microprocessors and Microsystems 2.6
编辑推荐:
本文针对多场景实时火灾监测需求,提出基于深度学习的轻量化网络模型YOLO-Fire,通过深度可分离卷积(Depthwise Separable Convolution)、ECA注意力机制(ECA Attention Mechanism)及多尺度特征融合等优化策略,结合ZYNQ7020平台设计的硬件加速器IP核,实现卷积、池化等层的高效加速,在BoWFire数据集上显著提升检测精度与推理速度(达ARM平台的74.43倍),为嵌入式前端部署提供低成本、低功耗的解决方案。
Highlight
Design and implementation of the YOLO-fire object detection algorithm
YOLO系列算法在检测速度与精度之间取得了良好平衡,但在特定场景下的准确性和检测效率可能不稳定。因此,本章专注于针对火灾检测场景设计火焰检测算法,并改进YOLOv4-tiny算法,构建了YOLO-Fire目标检测网络模型。通过实验测试验证了算法的有效性。
Accelerated IP core design and hardware architecture design
FPGA在加速器IP核设计中具有显著优势,适用于多种应用场景的高效数据加速。为加速YOLO-Fire的推理过程,特别是实现更快的计算速度和更高效率,本文在FPGA上设计了一款加速器IP核。
Dataset
本文通过录制易火场景中小火焰燃烧的视频帧,构建了一个私有小型火焰数据集。为验证所提出模型的泛化能力,我们还使用了公开数据集,包括韩国启明大学CVPR实验室提供的数据集以及Chino等人提供的BoWFire火焰数据集。这些数据集包含来自不同场景的火焰、非火焰及可分类火焰图像。所有数据均经过数据增强以形成最终训练集。
Conclusion
本文成功将深度学习技术与硬件加速相结合,在ZYNQ平台上开发并实现了高性能火灾检测系统。通过全面测试与验证,该系统表现出卓越的可靠性和有效性。在深度学习模型优化方面,我们引入深度可分离卷积(Depthwise Separable Convolution)替代YOLOv4-tiny中的常规卷积,实现了模型轻量化。此外,我们还修改了网络结构,增强了多尺度特征融合能力,并嵌入ECA注意力机制以提升特征表达能力。在硬件加速方面,我们基于ZYNQ7020平台设计了专用加速器IP核,采用循环分块策略(Loop Tiling)、约束语句(Constraint Statements)以及输入输出通道双维度并行优化,结合定点量化(Fixed-Point Quantization)和资源优化,显著提升了卷积、池化和上采样层的计算效率。实验结果表明,YOLO-Fire在BoWFire公共火焰数据集及自建数据集上均实现了精度、召回率和F1分数的提升,且在ZYNQ平台上的平均推理时间比主流ARM AI平台快约74.43倍,验证了所提出加速方法的有效性。
Declaration of competing interest
作者声明不存在已知可能影响本报告工作的竞争性财务利益或个人关系。
Wei Zeng received the B.Sc. degree from Chengdu University of Technology, Chengdu, China, in 1999, and the M.Sc. degree from Beijing Normal University, Beijing, China, in 2006. He is currently a Professor with College of Computer Science and Cyber Security (Pilot Software College), Chengdu University of Technology, Chengdu, China. He is also a researcher of China State Key Laboratory of Geological Hazard Prevention and Geological Environmental Protection, and a researcher of Sichuan Engineering...
生物通微信公众号
知名企业招聘