本文共 4941 字,大约阅读时间需要 16 分钟。
特别备注:文章转载自简书作者“路过的猪”。红黑树相对其他数据结构不是那么好理解,特别是插入和删除后平衡调整部分。有许多大佬都写了关于红黑树的文章,但是看完后还是稀里糊涂,好在参考了原作者的文章,正如作者文章中所述“现在回头看插入平衡的这几种情形,其实并不复杂”,所以在这里特别感谢下原作者!
红黑树是一种二叉搜索树,为了避免二叉排序树退化成链表导致查找的时间复杂度增加,在操作的时候做了平衡处理,,也就是相对于二叉搜索树做了一定的改进。
红黑树具有下列五种性质:
有一些红黑树定义(比如维基百科),还有一个性质:
引入黑色的NULL节点并不会对之前的定义产生影响(各路径都增加一个黑色节点,黑色数量依然相等),其目的更多是为了简化平衡操作的情况,平衡时可以认为:null就是黑色节点。此时只需要考虑红和黑这两种情况就行,而不用考虑非红非黑的null。
说插入之前,先来看看旋转:
旋转后,原来“左小右大”的特点不会受到影响;影响的是左右子树的高度,右旋左子树高度-1,右子树+1;左旋右子树高度-1,左子树+1。
比如某棵树的左子树高度已经达到3,而右子树只有1,只需要右旋一下,左右子树高度都将调整为2。整棵树来看,高度就相当于降低了1(3 -> 2),这就是高度的“平衡”。旋转前首先要确定旋转的节点(姑且叫支点)是哪个,这个非常重要。比如上图右旋前,要以X为支点才能转成右侧那样,如果选择Y作为支点,则要往下一层看了(X节点将以P的角色出现)。
另外留意一下b:
右旋前,b是挂在Y的右子,而右旋后,挂到了X的左子了; 左旋前,b是挂在X的左子,而左旋后,挂到了Y的右子了;开始之前,我们先约定一下名称:
红黑树属于二叉搜索树,插入动作也与二叉搜索树一致,只不过红黑树在插入之后,多了平衡动作(旋转与涂色)。
新插入的节点均为红色节点,因为红色不会影响路径上黑色节点的数量,保持性质4。如果父节点为黑色,就直接结束了;如果父节点为红色,则需要另外处理了。
以新插入的节点为当前平衡节点N,插入平衡大体上分为以下情形:
情形1. N为根节点(父节点为NULL)
当前平衡节点N为根节点时,直接涂黑根节点即可。
情形2. 父黑
父节点为黑色时,无需其他操作,已然平衡。
情形3. 父红-叔红
父红-叔红时,将父/叔节(P/U)点涂黑,祖父节点(GP)涂红;而后以祖父节点(GP)作为新的平衡节点N,递归执行平衡操作。
情形4. 父红-叔黑
情形4.1 父节点和N同一边
情形4.1.1 父N同左
“父N同左”指的是:父节点为祖父节点的左子,N为父节点的左子。
此时以祖父节点(GP)为支点进行右旋;然后将P涂黑,将GP涂红。
旋转后,P涂黑是因为要涂为原GP的黑色(往上兼容GP的父节点);而GP涂红则是因为右旋后,经过U的路径的黑色节点数量+1,涂红进行数量平衡;下同。
情形4.1.2 父N同右
“父N同右”指的是:父节点是祖父节点的右子,N为父节点的右子。
此时以祖父节点(GP)为支点进行左旋;将P涂黑,将GP涂红。
情形4.2 父节点和N不在同一边
情形4.2.1 父左N右
“父左N右”指的是:父节点是祖父节点的左子,N为父节点的右子。
此时,以父节点(P)进行左旋,旋转后,以P作为新的平衡节点N,转至 [情形4.1.1 父N同左] 处理。
情形4.2.2 父右N左
“父右N左”指的是:父节点是祖父节点的右子,N为父节点的左子。
此时,以父节点(P)进行右旋,旋转后,以P作为新的平衡节点,此时再进行【情形4.1.2 父N同右】处理。
首先是先插入再说;插入后,以刚插入的节点作为当前平衡节点N,进行平衡操作。现在回头看插入平衡的这几种情形,其实并不复杂:
例:插入 10,20,15,30,5,8;
为了简化,图中没有画出null的黑色节点。
红黑树和二叉搜索树的删除类似,只不过加上颜色属性(这里的子节点均指非NULL节点):
我们发现,删除情形3总是会转换为情形1和2的,而情形1.1和情形2处理平衡非常简单,本文主要讨论的是情形1.2:删除黑色的叶子节点。因为一旦该节点被拿掉,红黑树中通过该节点的路径黑色节点数量将会减1,而且无法像情形2那样将子节点涂黑来达到平衡。此时只能自底向上进行平衡操作。
这里的图特意将黑色的NULL节点给加上,这是因为删除节点被摘掉后,我们可以用一个黑色的节点接上,从而进行统一处理。
我们先约定一下节点名称:
h(A->B->叶子)表示从A走到B再走到某一个叶子路径的黑色节点数量(A与B,B与叶子之间可能间隔了多个节点)
本文余下内容均指的是删除黑色的叶子节点后引发的一系列平衡操作。比如P->D->N,删除D(黑色)后,N接至父节点:P->N。
因为删除了一个黑色节点(N的父节点D),经过N的路径的黑色数量减1,即h(P->N->叶子) 比 h(P->S->叶子) 少1。平衡的方式有:(1)h(P->N->叶子)不变,h(P->S->叶子)减1,此时已经子平衡;然而h(GP->P->叶子)还是会比h(GP -> U ->叶子)少1。此时需要将P当作新的N,向上递归处理;
(2)h(P->N->叶子)加1,h(P->S->叶子)不变,也就是恢复了原来的状态,此时已经平衡,因为h(GP->P->叶子)=h(GP -> U ->叶子)。本文下面平衡的思路主要就是基于以上两种方式,另外要注意的是,红色和红色不能连一起的约束也不能违反。理解这个比较重要。
GP->P->叶子 的路径,要么经过N,要么经过S,如果h(P->N->叶子)和h(P->S->叶子)均少1了,自然h(GP->P->叶子)会少1。
删除平衡情形,主要根据 [兄节点的位置/颜色]、[兄的子节点的颜色]、[父节点颜色] 进行分类:
N节点的位置知道后,S的位置自然也就知道了,相反亦可;这里以S位置作为分类,主要是为了便于理解和记忆。
情形1 当前节点为根节点(父节点为NULL)
比较特殊的情况,无需平衡操作。因为经过根节点的黑色数量少一个,意味着所有路径都少一个,已然平衡。
情形2 兄弟节点为黑色(S=黑)
情形2.1 兄弟的子节点全黑(SL/SR=黑)
兄弟节点的子节点全为黑色,也就意味着兄弟节点(S)可以涂红而不会和子冲突。S涂红后,也就实现了子平衡,
这时候我们看父节点是红是黑,再做处理。情形2.1.1 父节点为黑色(P=黑)
此时将S涂红,父节点作为新的平衡节点N,递归上去处理。
这个也就是之前提到的h(P->N->叶子)不变,h(P->S->叶子)减1;而h(GP->P->叶子),依然会比h(GP -> U ->叶子)少1,所以要递归上去处理。
情形2.1.2 父节点为红色(P=红)
此时将S涂红,P涂黑,平衡结束。
S涂红后,h(P->N->叶子)不变,h(P->S->叶子)-1,实现子平衡;因为P节点是红色的,如果将它涂黑,h(P->N->叶子)和h(P->S->叶子)均会+1,就可以恢复原来的状态了,而不用递归上去。
情形2.2 兄弟的子节点不全黑
所谓的不全黑包括:[SL红, SR红]、[SL黑,SR红]、[SL红,SR黑]。如果其中一个为黑,另外一个肯定是红。
以全黑/非全黑作为分类,是因为全黑时无论N是在左子还是右子,其处理方式是一样的。 而非全黑则要看N所处的位置(或者说S所处的位置)进行特定方向的旋转。为了方便理解和记忆,以S进行分组:
S为左子时(即N为右子),主要分两组 [SL=红]、[SL=黑]。 S为右子时(即N为左子),主要分两组 [SR=红]、[SR=黑]。【S为左子,SL红】与【S为右子,SR红】处理方式对称;
【S为左子,SL黑】与【S为右子,SR黑】处理方式对称。情形2.2.1 S为左子,SL红;S为右子,SR红
情形(1) S为黑色,S为左子,SL红时:
以P为支点右旋;交换P和S颜色,SL涂黑;平衡结束。 这里的平衡思路其实就是:h(P->S->叶子)不变(因为SL涂黑补回来了),h(P->N->叶子)+1(因为多了个黑色P)。
通常旋转后,新的P节点往往都会涂成原P的颜色:一是为了让GP-P不会颜色冲突;二是保持经过P的路径黑色数量不变。
对称的情形(2):S为黑色,S为右子,SR红时:
以P为支点左旋;交换P和S颜色(S涂为P原颜色,P涂黑),SR涂黑;平衡结束。
情形2.2.2 S为左子,SL黑;S为右子,SR黑
情形(1) S为黑色,S为左子,SL黑
以S为支点左旋,交换S和SR颜色(SR涂黑,S涂红) ,此时转至情形2.2.1-(1) S左-SL红 进行处理。
S涂红是为了使h(原S->SR->叶子)不变。
对称的情形(2) S为黑色,S为右子,SR黑
以S为支点右旋,交换S和SL颜色(SL涂黑,S涂红),此时转至2.2.1-(1) S右-SR红进行处理。
情形3 兄弟节点为红色(S=红)
情形(1) S为左子时,以P进行右旋;
情形(2) S为右子时,以P进行左旋; 旋转后交换P和S的颜色(S涂黑,P涂红),N兄弟节点变为黑色,进入情形2-兄弟节点为黑色进行处理。
现在我们有一颗红黑树:
(1)删除50,删除动作-情形3 --> 删除动作-情形2,简单处理即可:
(2)删除70,即黑色叶子节点,进行平衡:
(3)删除60:
(4)删除10:
(5)删除20:
作者:路过的猪
链接:https://www.jianshu.com/p/96e652ccf720 来源:简书