今天终于知道 Redis 为什么要用跳跃表了

放低心态、认真学习，机会总是留给不断努力的自己

本篇说下跳表，首先，Redis 中的有序集合(Sorted Set)就是用跳表（Skip list）来实现的。

如果你了解过平衡二叉树，应该知道红黑树也可以实现快速的插入、删除和查找操作。那 Redis 为什么会选择用跳表来实现有序集合呢? 为什么不用红黑树呢?学完今天的内容，你就知道答案了。

1. 什么是跳表

先说一下单链表，是一种各性能比较优秀的动态数据结构，可以支持快速的插入、删除、查找操作。

对于一个单链表来讲，即便链表中存储的数据是有序的，如果我们要想在其中查找某个数据，也只能从头到尾遍历链表。这样查找效率就会很低，时间复杂度会很高，是O(n)。

那怎么来提高查找效率呢？如果像上图中那样，对链表建立一级“索引”，查找起来是不是就会更快一些呢?每两个结点提取一个结点到上一级，我们把抽出来的那一级叫作索引或索引层。你可以看我画的图。图中的down表示指针，指向下一级结点。

如果我们要查找某一个结点，比如 14，遍历第一级索引层，到 12 的时候下一个结点是 16，那查找的目标 14 就一定在这 2 个结点之间。然后通过 down 指针，找到原始链表这层遍历，此时只需要遍历 2 个结点就能找到目标结点 14 了，这样我们就实现了查找。整个过程只需要遍历 7 个结点就能找到，原先需要 10 个结点。

从中能看出，我们加了一级索引层，需要遍历的结点数相对于原来大大的减少了，提高了查找的效率。如果我们在加一个二级索引层，在查找效率上会不会更加的提升呢? 答案是肯定的。

由于列子结点较少，可能未很好的表达。查找效率提升不明显，我增加一个 64 个结点的链表，构建了一个五级引层。

从上图可以发现，查找 62 没有用索引的情况，要遍历 62 次个结点才能找到，现在只需要 11 个结点就能找到，效率提高很明显。所以，当链表长度越长，在构建索引后，查找效率提高越发的明显。

以上这种加多级索引的数据结构就称为跳表。跳表是能够提升查询效率的。接下来说下用跳表到底有多快。

2. 跳表有多快

一个单链表查询数据的时间复杂度是 O(n)，多级索引的跳表呢？

分析一下：n 个结点的链表，每 2 个结点会抽出 1 个结点作为上一级的一个结点，则第一级索引有 n/2 个结点，第二级索引 n/4 个结点，第三级 n/8 … 所以，第 J 级索引结点的个数是 J-1 级的 1/2 ，则第 J 级结点的个数就是 n/(2J) 。

若索引有 h 级，最顶层的索引有 2 个结点，我们可以得到 n/(2h)=2, 则 h=log2n-1。加上低层原始链表这一层，整个跳表结构的高度就是 log2n。

当我们查询数据时，若每层都需要遍历 m 个结点，那么在跳表中查询一个数据的时间复杂度就是 O(m*logn)。那么 m 为多少呢？

我们每一级都需要遍历 3 个结点，也就是说 m=3，为什么是 3 ？

若我们要查找的数据是 x，在第 J 级索引中，我们遍历到 y 结点，发现 x 大于 y，小于后面的结点 z，所以通过 y 的指针（down），从第 J 级索引下降到第 J-1 级索引。在第 J-1 索引中，y 和 z 中只有 3 个结点（包含 y 和 z）。索引，在 J - 1 级索引中查找书籍只需要遍历 3 个结点，所以，也就是每一级索引都最多只需要遍历 3 个结点。