利用ngAP在GPU上实现可扩展且非阻塞的自动机处理

《ACM Transactions on Computer Systems》:Towards Scalable and Non-blocking Automata Processing on GPUs with ngAP

【字体: 时间:2025年11月08日 来源:ACM Transactions on Computer Systems

编辑推荐:

  有限自动机在GPU上的并行处理面临线程利用率低、重复计算和时空局部性不足三大挑战。本文提出非阻塞自动机处理方法,通过预取计算、记忆化查询、私有化计算和去重编码四项优化,实验表明在20个应用中平均性能提升9.5倍,最高达1613倍。

  

摘要

有限自动机在各种应用中充当计算核心。尽管GPU提供了强大的并行处理能力,但由于三个挑战,其在自动机处理方面的潜力仍未得到充分利用:(1) 并行性不足导致线程利用率低下;(2) 由于许多状态对应相同的符号,从而产生重复计算;(3) 由于线程和状态之间的频繁重新映射以及不规则的内存访问,时间和空间局部性未能得到有效利用。我们发现,逐个符号地处理自动机会使执行过程串行化,从而限制了系统的可扩展性。为了解决这个问题,我们提出了非阻塞自动机处理方法(Non-blocking Automata Processing),该方法支持不同输入符号的并行处理,并包含以下几种优化措施:(1) 预取计算结果,通过允许多个符号同时被处理来提高线程利用率;(2) 通过查找表消除重复计算;(3) 将计算过程私有化,以保持线程状态映射并提升时间局部性;(4) 去重匹配集并编码常见的自动机模式,以减少内存使用并提高空间局部性。我们在20个应用中的实验评估表明,我们的方法相比现有的GPU自动机处理引擎平均性能提升了9.5倍,最高可达1,613倍。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号