红黑树 R-B Tree
红黑树是一种平衡二叉查找树。它是为了解决普通二叉查找树在数据更新的过程中,复杂度退化的问题而产生的。红黑树的最大深度 ,所以它是近似平衡,插入、删除、查找操作的时间复杂度都是 O(logn)。
- 平衡的二叉查找树,而非如AVL一般“严格”的平衡,它从根节点到各个叶子节点的最长路径,有可能会比最短路径大一倍
平衡二叉查找树
二叉树中任意一个节点的左右子树的高度相差不能大于 1。
从这个定义来看,上一节我们讲的完全二叉树、满二叉树其实都是平衡二叉树,但是非完全二叉树也有可能是平衡二叉树。
发明平衡二叉查找树这类数据结构的初衷是,解决普通二叉查找树在频繁的插入、删除等动态更新的情况下,出现时间复杂度退化的问题。
所以,平衡二叉查找树中“平衡”的意思,其实就是让整棵树左右看起来比较“对称”、比较“平衡”,不要出现左子树很高、右子树很矮的情况。这样就能让整棵树的高度相对来说低一些,相应的插入、删除、查找等操作的效率高一些。
红黑树的几个要求
- 根节点是黑色的;
- 每个叶子节点都是黑色的空节点(NIL),只一个子树的节点,其另外一个子节点指针也指向 nil 节点;根节点的父节点也指向 nil 节点。也就是说,叶子节点不不存储数据(为了简化红黑树的代码实现而设置的)
- 任何相邻的节点都不能同时为红色,也就是说,红色节点是被黑色节点隔开的
- 每个节点,从该节点到达其可达叶子节点的所有路径,都包含相同数目的黑色节点
对于红黑树的疑问
- 为什么叫红黑树,红和黑的含义?
- 它从根节点到各个叶子节点的最长路径,有可能会比最短路径大一倍?为什么会出现这种情况?
- 红黑树的几个要求,为什么这么要求?
- 为什么要有旋转?
- 为什么工程中都喜欢用红黑树,而不是其他平衡二叉查找树呢?
- 红黑树最坏情况为何不是退变为链表的情况?
针对疑问,探究红黑树的背后原型 2-3树 2-3-4树
wiki: https://zh.wikipedia.org/wiki/2-3-4%E6%A0%91
关于2-3树与红黑树的关系,以及左旋右旋与2-3树变换的对应,以下资料有比较详尽以及形象的说明,在此不再赘述。阅读完之后,上述疑问大多可以解答。
- 左倾红黑树与2-3树关系: https://riteme.site/blog/2016-3-12/2-3-tree-and-red-black-tree.html
- 234树与红黑树:https://blog.csdn.net/v_JULY_v/article/details/6531399 原版:http://www.cs.princeton.edu/~rs/talks/LLRB/RedBlack.pdf
2-3树删除操作总结:
大致思路:
- 根据二叉查找树的特征,删除中间节点,可以转化为删除前驱结点或者后继节点,则可以交换到删除底部节点
- 如果删除的是2-底部节点,则没有节点补充空缺,如果删除的key位于是3-节点或4-节点,则节点并未发生空缺,所以要保证删除的key在3-节点或4-节点中
- 为了在最后删除的时候key能位于一个3-节点或4-节点中,我们必须确保在查找被删除的节点的路径上必须一直有3-节点。
红黑树的旋转与发色
红黑树的旋转,反色操作是为了在保证二叉搜索树和红黑树的性质的前提下,来转换红链接的位置。
总结:
子节点上升,父节点抢夺内侧孙节点
反色
插入操作
- 红节点插入不影响红黑树的性质,所以插入节点设置为红节点
插入的父节点为黑节点,直接插入
-
插入的父节点为红节点,红节点相邻,违反了要求3,可以按两种情况处理:
a 为插入节点(关注节点),b为父节点,d为叔节点,c为祖父节点2.1. 旋转(处理叔节点d为黑的情况)父节点与祖父节点进行旋转,调整结束
2.2. 反色(处理叔节点d为红的情况)父节点与祖父节点进行反色,反色后需要祖父节点作为关注节点,向上递归
删除操作
- 删除后继节点,通过补黑色满足要求4(每个节点,从该节点到达其可达叶子节点的所有路径,都包含相同数目的黑色节点)
- 处理要求4,同时处理多
关于case4的思考
为什么可以借黑节点?如何消除?
- 旋转会导致黑色节点数目失衡,可以借助这一特性实现消除黑色节点
示例:
https://blog.csdn.net/v_JULY_v/article/details/6284050
红黑树的简单实现:LLRB左倾红黑树
红黑树已经有很长的历史,在许多现代编程语言的符号表中都有使用,但是其缺点也很明显,其代码实现过于繁杂。因此出现的红黑树的修改版——左倾红黑树
llrb论文:http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.139.282
相对于经典红黑树来说,增加了要求:红链接均为左链接。