E2CAP:一种高效的FPGA加速器,用于深度强化学习,具备经验压缩功能以及可配置的PE阵列

《IEEE Transactions on Very Large Scale Integration (VLSI) Systems》:E2CAP: An Energy-Efficient FPGA Accelerator for Deep Reinforcement Learning With Experience Compression and Configurable PE Array

【字体: 时间:2025年11月27日 来源:IEEE Transactions on Very Large Scale Integration (VLSI) Systems 3.1

编辑推荐:

  DRL加速器E2CAP通过经验池压缩和可配置处理核心解决内存与计算效率问题,在FPGA上实现DQN训练,经验数据压缩比达98.19%,能效比CPU和GPU分别提升33.01倍和17.72倍,多维性能最优。

  

摘要:

深度强化学习(DRL)已成为解决机器人技术、自主系统和游戏等领域复杂决策任务的强大工具。然而,在硬件平台上加速DRL面临三个主要挑战:1)经验回放数据占用大量内存;2)由于权重排列问题导致权重访问效率低下;3)在深度神经网络(DNN)的推理和训练过程中处理元素之间的计算不平衡。为了解决这些问题,我们提出了E2CAP,这是一种专为DRL工作负载设计的节能型现场可编程门阵列(FPGA)加速器。E2CAP集成了一种压缩策略,显著减少了DRL模型中经验池的数据量,从而实现了经验池在芯片上的直接部署。此外,E2CAP还具备基于可配置处理单元(CPEs)的可配置阵列处理核心(CAP),支持CPE内部的以及CPE之间的配置。这种设计有效解决了权重排列问题和计算不平衡问题,提高了计算效率和硬件资源利用率。我们使用DQN算法在E2CAP上实现了完整的芯片级DRL推理和训练。实验结果表明,经验回放数据的压缩比达到了98.19%。与现有的CPU和GPU相比,E2CAP的能效分别提高了33.0117.72,同时在多维性能上也优于现有的基于FPGA的DRL加速器。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号