红黑树(RBT)的定义:它或者是一棵空树,或者具有以下性质的二叉查找树:
- 节点非红即黑;
- 根节点是黑色;
- 所有null节点成为叶子节点,且认为是黑色;
- 所有红节点的子节点都为黑色;
- 从任一节点到其叶子节点的所有路径上都包含相同数目的黑节点。
所有性质1~5合起来约束了该树的平衡性能-即该树上的最长路径不可能会大于2倍的最短路径。为什么?因为第1条该树上的节点非红即黑,由于第4条该树上不允许存在两个连续的红节点,那么对于从一个节点到其叶子节点的一条最长的路径一定是红黑交错的,那么最短路径一定是纯黑色的节点;而第5条从任一节点到其叶子节点的所有路径上都包含相同数目的黑节点,这么来说最长路径上的黑节点的数据和最短路径上的黑节点的数目相等!而第2条根节点为黑,第3条叶子节点是黑,那么可知:最长路径<=2*最短路径。一棵二叉树的平衡性越好,那么它的效率越高!显然红黑树的平衡性能比AVL的略差些,但是经过大量实验证明,实际上红黑树的效率还是很不错了,仍然达到O(logN).
插入操作
由于性质的约束:插入点不能为黑节点,应插入红节点。因为你插入黑节点将破坏性质5,所以每次输入的点都是红节点,但是其他的父节点也为红,那岂不是破坏了性质4?所以要做一些“旋转”和一些节点的变色!为了叙述方便,我们要给插入的节点标为N(红色),父节点为P,祖父节点为G,叔节点为U
情形1:该树为空树,直接插入根节点的位置,违反性质1,把节点颜色由红改为黑即可。
情形2:插入节点N的父节点P为黑色,不违反任何性质,无需做任何修改
情形3:N为红,P为红(祖父节点一定存在,且为黑,下边同理)U也为红,这里不论P是G的左孩子,还是右孩子;不论N是P的左孩子,还是右孩子。
操作:如图把P、U改为黑色,G改为红色,未结束。
解释:N,P都为红,违反性质4;若把P改为黑,符合性质4,显然左边少了一个黑节点,违反性质4;所以我们把G,U都改为相反色,这样一来通过G的路径的黑节点数目没变,即符合4,5,但是G变红了,若G的父节点又是红的不就违反了4,是这样,所以经过上边操作后危机诶单,需要把G作为起始点,即把G看做一个插入的红节点继续向上搜索---属于那种情况,按这种情况操作,要么中间就结束,那么直到根节点(此时根节点变红,一根节点向上搜索,没有了,将其变成黑色)。
情形4:N为红,P为红,U为黑,P为G的左孩子,N为P的左孩子(或者P为G的右孩子,N为P的右孩子;同向的)
操作:如图P、G变色,P、G变换即左左单旋(或者右右单旋),结束。