浅析Redis底层数据结构Dict

更新时间：2023年05月30日 09:23:12 作者：WARRIOR

Redis是一个键值型的数据库，我们可以根据键实现快速的增删改查，而键与值的映射关系正是通过Dict来实现的，当然 Dict 也是 Set Hash 的实现方式，本文就详细带大家介绍一下Redis底层数据结构 Dict，,需要的朋友可以参考下

Dict 的结构

Dict 由三部分组成，分别是：dict、dictht、dicEntry

dictht

dictht 的结构如下：

typedef struct dictht {
    dictEntry **table;
    unsigned long size;
    unsigned long sizemask;
    unsigned long used;
} dictht;

dictEntry **table，哈希表数组
unsigned long size，哈希表大小（取值为 2n2^n2n）
unsigned long sizemask，哈希表大小掩码，用于计算索引值，总是等于 size−1size - 1size−1
unsigned long used，该哈希表已有的节点数量

dicEntry

dicEntry 结构如下

void *key;/*键*/
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v; /*值*/
    struct dictEntry *next;/*下一个 entry 的指针*/
} dictEntry;

dicEntry 和 dictht 之间的组织方式如下图所示

当我们向 Dict 添加键值对时，Redis 首先根据 key 计算出 hash值（h），然后利用 h & sizemask 来计算元素应该存储到数组中的哪个索引位置。我们存储 k1=v1，假设 k1 的哈希值 h =1，则 1&3 = 1，因此 k1=v1 要存储到数组角标 1 位置。
如果计算出来的数组角标值相同，也就是说，出现了 *哈希冲突，redis 采用 ”链式哈希“ 的方式，将具有相同哈希值的数据串起来，形成链结构，这也就是为什么会有 struct dictEntry next 这个成员变量存在

💡 为什么是 h & sizemask ？在根据 hash 值（h）来计算应该把 entry 放在哪个数组下标位置时，你可能会好奇，为什么不是使用 h%size ，而是使用 h&sizemask，而他们为什么可以得出一样的结果。
实际上，当散列表的大小为 2n2^n2n 时，h%sizemask 的结果与 h%size 是相同的（这里不做证明）。让我们以 size 为 8 的散列表为例：

size = 8，对应的 sizemask = 7 (111的二进制表示)
h = 18 (10010的二进制表示)
h%size = 18%8 = 2
h&sizemask = 18&7 = 2

dict

在实际使用哈希表时，Redis 没有使用 dictht ，而是定义一个 dict 结构体，如下

typedef struct dict {
    dictType *type; /* dict类型，内置不同的hash函数 */
    void *privdata; /* 私有数据，在做特殊hash运算时用 */
    dictht ht[2] ;/* 个Dict包含两个哈希表，其中一个是当前数据，另一个一般是空，rehash时使用 */
    long rehashidx; /* rehash的进度，-1表示未进行 */
    int16_t pauserehash; /* rehash是否暂停，1则暂停，0则继续 */
} dict;

在上面这个结构体中，我们发现，type 、privdata 是跟哈希运算有关系的，但是其他三个成员变量，又是用来做什么的呢？为什么又要定义两个 dictht 呢？这跟我们下面要说的 rehash 操作有关系

Dict 的 rehash

前面我们提到，redis 使用链式哈希来解决 hash 冲突问题。但是，链式哈希也存在局限性，那就是随着链表长度的增加，Hash 表在一个位置上查询哈希项的耗时就会增加，从而增加了 Hash 表的整体查询时间，这样也会导致 Hash 表的性能下降。这时，redis 使用 rehash 来解决这个问题。

Redis 如何实现 rehash

Redis 实现 rehash 的基本思路是这样的：

首先，Redis 准备了两个哈希表，用于 rehash 时交替保存数据。
- 前面我们提到，redis 在实际使用时，定义了一个 dict 结构体。这个结构体中有一个数组（*ht[2] *），包含了两个 Hash 表（dictht ） *ht[0] *和 *ht[1] *。
其次，在正常服务请求阶段，所有的键值对写入哈希表 ht[0]。
接着，当进行 rehash 时，键值对被迁移到哈希表 ht[1]中。
最后，当迁移完成后，ht[0]的空间会被释放，并把 ht[1] 的地址赋值给 ht[0]，ht[1] 的表大小设置为 0。这样一来，又回到了正常服务请求的阶段，ht[0] 接收和服务请求，ht[1] 作为下一次 rehash 时的迁移表。

什么时候进行 rehash

当我们往 Redis 中写入新的键值对或是修改键值对时，Redis 都会判断下是否需要进行 rehash。而 rehash 的触发条件则是
- 条件 1 ：ht[0] 承载的元素个数已经超过了 ht[0] 的大小，也即d->ht[0].used >= d->ht[0].size，同时 Hash 表可以进行扩容。
- 条件 2 ：ht[0] 承载的元素个数，是 ht[0] 的大小的 dict_force_resize_ratio 倍，也即 d->ht[0].used/d->ht[0].size > dict_force_resize_ratio 其中，dict_force_resize_ratio 的默认值是 5。

rehash 的新 size 是多大?

如果是扩容，则新 size 为第一个大于等于 dict.ht[0].used+1 的2n2^n2n 如果是收缩，则新 size 为第一个大于等于 dict.ht[0].used 的 2n2^n2n（不得小于4）

渐进式 rehash

Hash 表在执行 rehash 时，由于 Hash 表空间扩大，原本映射到某一位置的键可能会被映射到一个新的位置上，因此，很多键就需要从原来的位置拷贝到新的位置。而在键拷贝时，由于 Redis 主线程无法执行其他请求，所以键拷贝会阻塞主线程，这样就会产生 rehash 开销。为了降低 rehash 开销，Redis 就提出了渐进式 rehash 的方法。

rehash 的步骤

给 ht[1] 分配空间；
在 rehash 进行期间，在rehash过程中，新增操作，则直接写入 ht[1]，查询、修改和删除则会在dict.ht[0] 和 dict.ht[1] 依次查找并执行。这样可以确保 ht[0] 的数据只减不增。
随着处理客户端发起的哈希表操作请求数量越多，最终在某个时间点会把 ht[0] 的所有 key-value 迁移到 ht[1]，从而完成 rehash 操作。

这样就巧妙地把一次性大量数据迁移工作的开销，分摊到了多次处理请求的过程中，避免了一次性 rehash 的耗时操作。

以上就是浅析Redis底层数据结构Dict的详细内容，更多关于Redis数据结构Dict的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

详解redis分布式锁(优化redis分布式锁的过程及Redisson使用)
在分布式的开发中，以电商库存的更新功能进行讲解，在实际的应用中相同功能的消费者是有多个的,这篇文章主要介绍了redis分布式锁详解(优化redis分布式锁的过程及Redisson使用),需要的朋友可以参考下
2021-11-11
Redis数据迁移RedisShake的实现方法
本文主要介绍了Redis数据迁移RedisShake的实现方法,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
2022-04-04
redis2.8配置文件中文翻译版
这篇文章主要介绍了redis2.8配置文件中文翻译版,本文翻译了配置文件中的参数说明,非常详细,需要的朋友可以参考下
2015-06-06
Windows中Redis安装配置流程并实现远程访问功能
很多在windows环境中安装Redis总是出错，今天小编抽空给大家分享在Windows中Redis安装配置流程并实现远程访问功能，本文通过图文并茂的形式给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友参考下吧
2021-06-06
详解Redis中地理位置功能Geospatial的应用
Geospatial Indexes 是 Redis 提供的一种数据结构，用于存储和查询地理位置信息，这篇文章就来和大家详细讲讲Geospatial的具体应用吧
2023-06-06
手动实现Redis的LRU缓存机制示例详解
这篇文章主要介绍了手动实现Redis的LRU缓存机制示例详解,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-03-03
Redis排序命令Sort深入解析
这篇文章主要为大家介绍了Redis排序命令Sort深入解析，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-12-12
利用Redis实现防止接口重复提交功能
大家好，本篇文章主要讲的是利用Redis实现防止接口重复提交功能，感兴趣的同学赶快来看一看吧，对你有帮助的话记得收藏一下，方便下次浏览
2021-12-12
在Mac OS上安装Vagrant和Docker的教程
这篇文章主要介绍了在Mac OS上安装Vagrant和Docker的教程,并安装和设置Postgres和Elasticsearch和Redis,需要的朋友可以参考下
2015-04-04
详解redis中的锁以及使用场景
这篇文章主要介绍了详解redis中的锁以及使用场景，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-12-12