有序集合Sorted Set
zadd
zadd用于向集合中添加元素,添加三门编程语言,分值分别为1、2、3:
1 | 127.0.0.1:6379> zadd language 1 java |
zrange
zrange根据分值区间返回符合条件的数据:
1 | 127.0.0.1:6379> zrange language 1 3 withscores |
zscore
zscore根据key和元素值返回元素的分值
1 | 127.0.0.1:6379> zscore language python |
Sorted Set是Redis中的一种数据结构,它可以用来存储带有分值的元素,并且根据分值进行排序,是一个有序的集合。
Sorted Set的结构定义如下,它包含了一个哈希表dict和一个跳跃表zskiplist,其中哈希表可以在O(1)的时间复杂度内进行元素查找,而跳跃表可以支持高效的范围查询:
1 | typedef struct zset { |
跳跃表
如果一个有序集合中包含的元素数量比较多或者有序集合中的元素是比较长的字符串时,Redis就会使用跳跃表作为有序集合的底层实现。
跳跃表是一种多层的有序链表,在一个普通的有序链表中如果想要查找某个元素,必须遍历链表,时间复杂度为O(n),那么如何提高查找效率呢,可以使用跳跃表,从列表中抽出一些元素进行分层,比如每隔一个节点就抽出一层:
此时如果需要查找元素为9的节点:
- 从第三层开始查找,元素的值为8,因为9大于8并且8之后没有其他的节点所以接下来进入第二层
- 进入第二层,8的下一个节点为15,9小于15,所以进入第一层
- 进入第一层,获取8的下一个节点,等于要查找的值9,查找结束
结构定义
跳跃表的结构定义
- header:指向跳跃表中节点的头指针,跳跃表中的节点定义为zskiplistNode,跳跃表实际上也是一个链表,所以会有一个头结点
- tail:指向跳跃表中节点的尾指针
- length:跳跃表中节点的数量
- level:跳跃表的层级
1 | // 跳跃表 |
节点的结构定义
- ele:一个sds类型的变量,存储实际的数据
- score:存储数据的分值,跳跃表就是按照这个分值进行排序的
- backward:一个指向前一个节点的指针,为了便于从后往前查找
- zskiplistLevel:一个层级数组,因为跳跃表可以有多层,每一层中都有一个指向当前层级中的下一个节点的指针forward和span跨度,跨度代表了当前层级里面,当前节点与下一个节点直接跨越了几个节点
1 | //跳跃表中的节点结构定义 |
跳跃表的创建
1 | /* 创建跳跃表节点*/ |
跳跃表层数的设置
跳跃表根据什么规则来进行层数划分呢,有以下几种方案:
方案一
每隔一个节点,就取出一个节点作为新的一层的节点,这样每一层上节点的数量大约是下一层节点数的一半,此时类似于二分查找,查找复杂度为O(logn)
优点:查找的时间复杂度降低了
缺点:由于需要维护每个层级的节点数,在节点进行插入或者删除的时候,要调整层级节点,带来额外的开销
方案二
新增加节点的时候,调用随机生成层数方法,随机生成一个当前跳跃表所需要的层数,如果生成的层数等于当前层数,新节点只需要加入跳跃表中即可,不需要额外的维护每一个层级的节点数,Redis中就是使用的随机生成层数的方式维护跳跃表的层级。
随机生成层数方法:
1 |
|
0xFFFF = 65535
random()&0xFFFF运算之后会生成一个0和65535之间的数,ZSKIPLIST_P 0xFFFF = 0.25 65535,所以random()&0xFFFF 小于 0.25 * 65535的概率为25%,也就是层数会增加1的概率不超过25%。
跳跃表增加节点
- 因为跳跃表有多层,所以需要遍历每一层,寻找每层要插入的位置,update[i]就记录了每一层要插入的位置
- 随机生成跳跃表的层数,如果层数有变化,则需要调整跳跃表的层高
- 创建节点,并将节点插入到跳跃表中
- 设置backward,新插入节点的前一个节点是update[0],如果update[0]为头结点,当前节点的前一个节点设为null,否则backward设置为update[0]
1 | zskiplistNode *zslInsert(zskiplist *zsl, double score, sds ele) { |
总结
- Sorted Set支持在添加元素的时候为元素添加一个分值,并根据分值排序,是一个有序的集合。
- Sorted Set在数据比较少的时候采用ziplist存储,超过阈值后使用哈希表和跳跃表来提高查找效率,其中哈希表用于单值查询,跳跃表用于范围查询。
- 跳跃表是一个多层的有序链表,它采用了空间换时间的方式将查找的时间复杂度降到了O(logN)。
参考
黄健宏《Redis设计与实现》
陈雷《Redis5设计与源码分析》
【unix21】redis源码分析–zslRandomLevel位运算解析
【有梦想的肥宅】Redis5设计与源码分析读后感(三)跳跃表
Redis版本:redis-6.2.5