基于自适应动态分组与GC-LSM树管理的键值分离扫描性能优化系统SoKV研究

【字体: 时间:2025年08月15日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  本文提出SoKV系统,通过自适应动态分组策略(Adaptive Dynamic Grouping)优化键值分离(KV Separation)存储中的扫描性能,结合基于垃圾回收(GC)的LSM树管理方法,显著提升扫描吞吐量(达RocksDB的2.66倍)并降低更新延迟。创新性解决值空间有序性恢复与键空间LSM树膨胀问题,为现代大数据场景下的高效数据检索提供新范式。

  

Highlight亮点

键值(KV)存储作为系统软件基础技术,其分离式架构中扫描操作需遍历LSM树获取值地址,性能受值空间有序性和LSM树规模双重制约。本研究通过创新策略突破性能瓶颈,实验显示SoKV扫描吞吐量全面领先主流系统。

LSM-tree based KV Stores基于LSM树的键值存储

如图2所示,LevelDB采用多级有序结构:写入数据先缓存在MemTable,满转存为L0级SSTable文件。合并(Compaction)操作虽维持数据有序性,但引发严重读写放大问题。KV分离技术(如WiscKey)将大体积值存于独立Value Log,但垃圾回收(GC)时需遍历LSM树验证有效性,产生额外开销。

Design Goals of SoKV系统设计目标

实验发现FenceKV固定分组导致值空间有序性随更新逐渐劣化,且LSM树持续膨胀。SoKV提出双重优化目标:1)动态调整分组边界,高频扫描组优先触发GC恢复有序性;2)精简LSM树规模,删除GC后无效的SSTable元数据。

Implementation Details of SoKV实现细节

系统架构包含智能分组控制器与LSM树管理器。自适应分组策略为每个组设计动态GC阈值,根据扫描热度决定分裂(提升有序性)或合并(延迟GC)操作。GC-LSM管理方法通过键范围比对,直接删除完全覆盖的SSTable,降低42%树规模。

Evaluation性能评估

在YCSB基准测试中,SoKV扫描吞吐量达10.38倍于Parallax,更新性能因LSM树精简提升19%。值空间有序性恢复速度比FenceKV快2.1倍,验证动态分组策略有效性。

Conclusion结论

本研究突破键值分离系统扫描性能瓶颈,通过生物启发式的动态调节机制(类似细胞分裂-融合周期),实现存储系统的自优化能力。SoKV为时序数据库统计聚合等长扫描场景提供高效解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号