0
点赞
收藏
分享

微信扫一扫

红黑树理解

SPEIKE 2022-03-18 阅读 101
c语言

        红黑树,是一种二叉搜索树,也可以理解为平衡树,但在每个结点上增加一个存储位表示结点的颜色,可以是红色或黑色。通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出俩倍,因而是接近平衡的。如下图:       

红黑树的性质

  1. 每个结点不是红色就是黑色

  2. 根节点是黑色的

  3. 如果一个节点是红色的,则它的两个孩子结点是黑色的

  4. 对于每个结点,从该结点到其所有后代叶结点的简单路径上,均包含相同数目的黑色结点

  5. 每个叶子结点都是黑色的(此处的叶子结点指的是空结点)

上面的4点性质用自己的话可以总结为:(性质5不用记)

  • 结点不是红色就是黑色

  • 没有连续的红色结点

  • 每条路径上的黑色结点的数量是一样的

AVL树是通过高度来控制平衡的,是严格平衡的。那如果新插入结点很多那么旋转也是要付出代价的。红黑树通过颜色来控制平衡,但不是严格的平衡,它近似平衡。红黑树也可以达到AVL树的效率。它最长路径不超过最短路径的2倍。

那为什么红黑树的最长路径不超过最短路径的2倍呢?

通过上面的性质,假设我们把红黑树的黑色结点单独抽出来,从跟到叶子黑结点个数为N个

那它最短路径就是长度为N
那它最长的路径可能是一黑一红

那它的长度为2N,所以它的最长路径不超过最短路径的2倍,则其他路径的长度就在N-2N之间。那么红黑树增删查改的效率就在logN-2logN之间,和AVL树的logN差不多了。

红黑树的插入

那么我们插入结点时选择插入黑结点还是红结点呢?

当然是选择插入红结点了。选择插入黑结点那麻烦就大了,那1条路径上就多了1个黑结点,破坏了性质4,代价很大。插入红结点,如果它的父亲结点是黑色则不用调整,拍拍屁股走人,它的父亲是红色那我们在进行后序的处理。

总结一下:

  • 插入黑色结点一定破坏性质4,调整起来会很麻烦

  • 插入红结点不一定破坏红黑树的性质,它的父亲结点是红色才进行调整,比插入黑结点调整起来方便。

插入的逻辑:

  • 找到插入结点的位置

  • 插入结点

  • 检测新结点插入后是否破坏了红黑的性质,如果破坏则需要进行处理

因为新插入结点的颜色是红色,若它的父亲结点是黑色不用调整,是红色的话需要对红黑树分情况来讨论。

红黑树调整主要看叔叔结点

下面我们根据叔叔结点的情况来具体看一下。

情况一

以下用p来代表parent结点,c代表cur为新增结点,g代表grandparent结点,u代表uncle结点。
我们还是跟AVL树一样画具象图:

叔叔结点存在且为红

为什么把g变成红色呢?如果g不变成红色,那此时子树上就多了1个黑结点了。
只要我们画出具象图,那面试时手撕红黑树也完全不怂。

当然还有很多种情况,那就给出抽象图:

这种情况下cur在p的左边还是右边都不影响。

情况二

叔叔结点存在且为黑,新增结点是p的左边

这是由情况一变来的,如果u存在那cur一定是黑的,不是新郑结点,这样才满足红黑树的性质。

新增结点是p的右边

情况三

叔叔结点不存在

新增结点在parent的左边

新增结点在parent的右边

总结一下:

以上的情况都是父亲结点在祖先结点的左边,在祖先结点的右边也是相同的处理方法

  • 叔叔结点存在且为红,把父亲结点和叔叔结点变黑,祖先变红继续向上处理直到祖先是根节点

  • 叔叔存在为黑,祖孙三代在一条直线上进行单旋,不在则进行双旋

  • 叔叔不存在,祖孙三代在一条直线上进行单旋,不在则进行双旋

所以2,3的逻辑可以合在一起,分为新增结点在父亲结点的左边还是右边处理。

下面再来简单的说说父亲结点在祖先结点的右边

叔叔存在且为红

此时,cur在p的左边还是右边没有影响。

叔叔存在且为黑

新增结点在父亲结点的右边

新增结点在父亲结点的左边

叔叔不存在

总结一下:

  • 叔叔存在且为红,u,p变黑,g变红继续向上调,直到g为根结点,最后把g变黑

  • 叔叔存在且为黑,祖孙3带在一条直线上单旋,折线要双旋

  • 叔叔不存在,祖孙3带在一条直线上单旋,折线要双旋

红黑树的和AVL树的简单比较

红黑树的删除也是了解,红黑树和AVL树都是高效的平衡二叉树,增删改查的时间复杂度都是O(log2),红黑树不追求绝对平衡,其只需保证最长路径不超过最短路径的2倍,相对而言,降低了插入和旋转的次数,所以在经常进增删的结构中性能比AVL树更优,而且红黑树实现比较简单,所以实际运用中红黑树更多。

         

举报

相关推荐

0 条评论