Radix Tree、B+树、跳表之间的区别

发表于2021-12-16|数据结构

|总字数:551|阅读时长:1分钟|浏览量:

B+树和跳跃表有什么关联？

B+树和跳跃表这两种数据结构在本身设计上是有亲缘关系的，其实如果把B+树拉直来看不难发现其结构和跳跃表很相似，甚至B+树的父亲结点其实类似跳跃表的level层级。
在当前计算机硬件存储设计上，B+树能比跳表存储更大量级的数据，因为跳表需要通过增加层高来提高索引效率，而B+树只需要增加树的深度。此外B+树同一叶子的连续性更加符合当代计算机的存储结构。然而跳表的层高具有随机性，当层高较大的时候磁盘插入会带来一定的开销，且不利于分块。

为什么Redis不使用B+树呢而选择跳表呢？

因为数据有序性的实现B+树不如跳表，跳表的时间性能是优于B+树的（B+树不是二叉树，二分的效率是比较高的）。此外跳表最低层就是一条链表，对于需要实现范围查询的功能是比较有利的，而且Redis是基于内存设计的，无需考虑海量数据的场景。

Radix Tree优势在哪？

本质上是前缀树，所以存储有「公共前缀」的数据时，比 B+ 树、跳表节省内存
没有公共前缀的数据项，压缩存储，value 用 listpack 存储，也可以节省内存
查询复杂度是 O(K)，只与「目标长度」有关，与总数据量无关
这种数据结构也经常用在搜索引擎提示、文字自动补全等场景

Radix Tree劣势在哪？

如果数据集公共前缀较少，会导致内存占用多
增删节点需要处理其它节点的「分裂、合并」，跳表只需调整前后指针即可
B+ 树、跳表范围查询友好，直接遍历链表即可，Radix Tree 需遍历树结构
实现难度高比 B+ 树、跳表复杂
不适合存储像UUID等，非对称结构的key（而且使用时候建议让Redis自动生成）

文章作者: edwin

文章链接: http://zhangwende.com/posts/31197/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 ING-BLOG！

🧋奶茶🧋

微信
支付宝

相关推荐

B树与B+树的区别

1、什么是B树如果用二叉树作为索引的实现结构，会让树变得很高，增加硬盘的I/O次数，影响数据查询的时间。因此一个节点就不能只有2个子节点，而应该允许有M个子节点(M>2)。 B树的出现就是为了解决这个问题，B树的英文是Balance Tree，也就是平衡的多路搜索树，它的高度远小于平衡二叉树的高度。在文件系统和数据库系统中的索引结构经常采用B树来实现。 B树的结构 B树作为平衡的多路搜索树，它的每一个节点最多可以包括M个子节点，M称为B树的阶。同时你能看到，每个磁盘块中包括了关键字和子节点的指针。如果一个磁盘块中包括了x个关键字，那么指针数就是x+1。对于一个100阶的B树来说，如果有3层的话最多可以存储约100万的索引数据。对于大量的索引数据来说，采用B树的结构是非常适合的，因为树的高度要远小于二叉树的高度。一个M阶的B树（M>2）有以下的特性：根节点的儿子数的范围是[2,M]。每个中间节点包含k-1个关键字和k个孩子，孩子的数量=关键字的数量+1，k的取值范围为[ceil(M/2),...

评论

数据加载中