通过在混合分区存储上缓存热点键来加速LSM-Tree键值存储的读写操作

《IEEE Embedded Systems Letters》:Accelerating LSM-Tree KV Stores via Caching Hot Keys on Hybrid Zoned Storage

【字体: 时间:2025年11月14日 来源:IEEE Embedded Systems Letters 2

编辑推荐:

  混合分区存储架构优化了基于LSM树的KV存储的读写性能,但读请求集中在低效的HM-SMR HDD上形成瓶颈。本文提出HZCI方案,通过混合粒度缓存设计、访问感知的缓存管理和读写平衡的压缩机制,在ZNS SSD与HDD混合架构中实现平均读吞吐量提升32%-52%。

  

摘要:

基于日志结构化合并树(LSM树)的键值(KV)存储在管理大规模非结构化数据方面变得至关重要。最近的研究提出了混合分区存储架构——结合了主机管理的瓦片式磁记录(HM-SMR)硬盘和分区命名空间(ZNS)固态硬盘——以平衡性能和成本,使其非常适合用于基于LSM树的KV存储。尽管已经开发出许多新方案来优化写入性能、垃圾收集和压缩开销,但读取性能仍然是一个关键挑战。具体来说,我们观察到读取请求通常集中在性能较低的HM-SMR硬盘上,导致严重的读取瓶颈。为了解决这个问题,我们提出了混合分区缓存改进(HZCI)来提高混合分区KV存储的读取效率。首先,我们构建了一个混合粒度的分区缓存,利用文件访问模式来发挥ZNS固态硬盘的高速特性。其次,我们引入了一种基于访问意识的缓存管理策略,以智能地管理ZNS固态硬盘中的KV缓存。最后,我们设计了一种压缩机制,在读取性能和压缩开销之间取得平衡,从而提高缓存效率。实验结果表明,与GearDB、ZoneKV和SpanDB相比,HZCI分别将平均读取吞吐量提高了32%、40%和52%。

引言

基于日志结构化合并树(LSM树)的键值(KV)存储将随机写入转换为顺序写入,使其非常适合大规模非结构化数据存储[1]、[2]、[3]、[4]。分区存储设备将其地址空间划分为仅支持顺序写入的区域,这与LSM树的顺序写入行为自然匹配。主流的分区存储设备包括主机管理的瓦片式磁记录(HM-SMR)硬盘[5]、[6]、[7]和分区命名空间(ZNS)固态硬盘[8]、[9]、[10],分别提供高容量和高性能。通过将HM-SMR硬盘和ZNS固态硬盘结合到混合分区存储架构中,KV存储可以将具有不同特性的数据放置在最合适的介质上,从而平衡性能和成本[11]。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号