0
点赞
收藏
分享

微信扫一扫

【机器学习】从线性回归模型看一个简单的成本函数

谷中百合517 2024-03-11 阅读 13

数据结构/C++:AVL树


概念

AVL树是一种自平衡二叉搜索树(BST),被命名为Adelson-Velskii和Landis树,以它们的发明者们的名字命名。AVL树通过在插入和删除操作后进行自旋操作来保持树的平衡,以确保树的高度始终保持在O(logN)。这样可以减少树的平均长度,提高搜索效率。

比如这就是一颗高度不平衡的树:
在这里插入图片描述

这是一颗AVL树:
在这里插入图片描述

那么我们要如何实现一颗AVL树?
一般的二叉搜索树在插入新节点以及删除节点时,都有可能会破坏树的平衡,所以AVL树需要对插入以及删除接口做修改,每次插入删除时,都要检测一下当前的树时候符合AVL树,如果不符合,要做出相应的调整措施。


实现

插入

限制于AVL树的要求,每个根节点的左右子树高度差绝对值不超过1,我们在此处为AVL树增加一个成员_bf,称为平衡因子(balance factor),其值为左右子树高度的差值,当这个差值的绝对值>=2,就说明这个节点的左右子树不平衡,那么我们就要使用相应的手段调整这棵树。在此处,本博客的平衡因子为 右子树高度 - 左子树高度,这样顺序没有严格要求。

AVL树节点类:

template<class K, class V>
struct AVLTreeNode
{
    AVLTreeNode* _left;
    AVLTreeNode* _right;
    AVLTreeNode* _parent;
    int _bf;
    pair<K, V> _kv;

    AVLTreeNode(const pair<K, V>& kv)
        : _left(nullptr)
        , _right(nullptr)
        , _parent(nullptr)
        , _bf(0)
        , _kv(kv)
    {}
};

首先,由于平衡因子的限制,我们的AVL树任何一颗高为h + 1的子树只有可能会出现以下三种情况:

在这里插入图片描述

也就是,平衡因子为01-1三种情况。
现在对这个AVL树进行插入操作,也就有多种可能,由于平衡因子为1-1的情况是对称的,所以此处先举例平衡因子为-1的情况:

在这里插入图片描述
三种情况分别是:

首先,对于第一种情况,两棵子树等高,在任意一边插入:
对于这颗子树,其会有一颗子树变高,一颗子树不变,更新平衡因子:从_bf = 0变成_bf = 1_bf = -1,此时平衡因子还处于正常范围内,这颗子树还是一颗AVL树。但是对于这颗子树的父节点,其一边的子树高度增加,所以还要往上影响父节点,往上继续判断。

对于第二种情况: 两棵子树不等高的情况,在矮的子树插入:
对于这颗子树,其矮的子树变高了,而且会与另外一颗子树等高,更新平衡因子:从_bf = 1_bf = -1变成_bf = 0。不影响AVL结构,原先整个子树高度是h + 1,插入节点后并没有影响整颗子树的高度,所以对于这个子树的父节点,不会受到影响。

对于第三种情况:两颗子树不等高的情况,在高的子树插入:
对于这颗子树,其高的子树变得更高了,更新平衡因子:从_bf = 1_bf = -1变成_bf = 2_bf = -2。这个插入操作影响了AVL树的结构,此时要立刻调整当前子树,让其平衡。

那么我们先写出当前的代码逻辑,既然要插入,那么就要先找到合适的位置插入,代码如下:

    bool Insert(const pair<K, V>& kv)
    {
        if (_root == nullptr)
        {
            _root = new Node(kv);
        }

        Node* cur = _root;
        Node* parent = nullptr;

        while (cur)
        {
            if (cur->_kv.first < kv.first)
            {
                parent = cur;
                cur = cur->_right;
            }
            else if (cur->_kv.first > kv.first)
            {
                parent = cur;
                cur = cur->_left;
            }
            else
            {
                return false;
            }
        }

        cur = new Node(kv);

        if (parent->_kv.first > kv.first)
            parent->_left = cur;
        else
            parent->_right = cur;

        cur->_parent = parent;
       
       //调整平衡
       //......
       //......
       //......
       
        return true;
    }

接下来,我先解析以上代码的逻辑:

至此我们就完成了插入操作,接下来就要根据一开始推导的三种情况进行调整。

既然我们在parent处插入了节点,那么我们第一步就是更新parent的平衡因子:

if (cur == parent->_left)
    parent->_bf--;
else
    parent->_bf++;

更新完平衡因子后,就要判断属于三种情况的哪一种:

if (parent->_bf == 0)
{
	//情况二
}
else if (parent->_bf == 1 || parent->_bf == -1)
{
	//情况一
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
	//情况三
}
else
{
    assert(false);
}

代码实现:

其不会影响自身的AVL结构,所以不用对自生做操作,但是由于其高度增加了,所以有可能会影响其父节点,那么此时我们就要去看看父节点是否平衡。而对于其父节点而言,也必然会是三种情况之一,所以我们只需要一个循环即可:

 while (parent)
 {
     if (cur == parent->_left)
         parent->_bf--;
     else
         parent->_bf++;

     if (parent->_bf == 0)
     {
     	//情况二
     }
     else if (parent->_bf == 1 || parent->_bf == -1)
     {
         cur = cur->_parent;
         parent = parent->_parent;
     }
     else if (parent->_bf == 2 || parent->_bf == -2)
     {
     	//情况三
     }
     else
     {
         assert(false);
     }
 }

解析:

因为其不会影响自己以外的节点,也没有破坏平衡,所以直接跳出while循环,啥也不用做。

if (parent->_bf == 0)
{
	break;
}

我们先看到当前的调整总代码:

 while (parent)
 {
     if (cur == parent->_left)
         parent->_bf--;
     else
         parent->_bf++;

     if (parent->_bf == 0)
     {
         break;
     }
     else if (parent->_bf == 1 || parent->_bf == -1)
     {
         cur = cur->_parent;
         parent = parent->_parent;
     }
     else if (parent->_bf == 2 || parent->_bf == -2)
     {
     	//情况三
        //调整平衡
        //......
        //......
        //......
     }
     else
     {
         assert(false);
     }
 }

现在只差情况三了,而情况三比较复杂,我们现在分析一下:
第三种情况如下:
在这里插入图片描述

也就是子树不等高的情况下,在高子树插入节点,导致原本高的子树更高了,破坏了平衡。
以左侧为例,我们将高度为h的子树拆分出来,其一定是是以下情况之一:

在这里插入图片描述

为什么一定是这两种情况?高度为h的子树的两个子树一定是h-1吗?其实并不是的,我们先看看如果有一颗子树不为h-1会发生什么:
在这里插入图片描述

可以看到,这两种插入的情况,左子树的值分别是-20。对于0,此时左子树本身高度既没有变化,也没有破坏AVL结构,根本就不会影响到最高处的节点。对于-2,此时左子树已经破坏了AVL结构,此时应该先对左子树直接调整,处理问题,而不是留到最顶上的节点时,再去调整左子树。因此这两种情况下,循环根本就到不了最顶部的节点,情况三的两棵子树高度一定相等

也就是以下情况:
在这里插入图片描述

对于左侧情况,叫做LL失衡(L表示left),对于右侧情况,叫做LR失衡(R表示right)。
LL失衡对应的是RR失衡,我们先解决这两种情况的失衡:
在这里插入图片描述

想要解决这两种失衡,就分别要用到左单旋算法右单旋算法


左单旋

我们先看到左单旋的示意图,再做讲解:
在这里插入图片描述

我来解析一下以上过程:

这个情况下,我们以subL为根的树是一颗平衡的树,而且平衡因子为0,插入节点前以parent为根的子树,高度为h+1,插入节点且旋转后高度仍为h+1插入前后高度不变,不会影响父节点,直接跳出循环

接下来我们完成左单旋的代码:

//左单旋
void RotateL(Node* parent)
{
    Node* subR = parent->_right;
    Node* subRL = subR->_left;

    parent->_right = subRL;
    if (subRL)
        subRL->_parent = parent;

    subR->_left = parent;
    Node* ppNode = parent->_parent;
    parent->_parent = subR;

    if (parent == _root)
    {
        _root = subR;
        subR->_parent = nullptr;
    }
    else
    {
        if (ppNode->_left == parent)
            ppNode->_left = subR;
        else
            ppNode->_right = subR;

        subR->_parent = ppNode;
    }

    parent->_bf = 0;
    subR->_bf = 0;
}

代码解析:

parent->_right = subRL;
if (subRL)
    subRL->_parent = parent;

此代码完成了parentsubL之间的链接,要注意的是,subRL有可能是空指针,比如这样:
在这里插入图片描述
所以在访问 subRL->_parent之前,需要先确保subRL不是空指针。

subR->_left = parent;
Node* ppNode = parent->_parent;
parent->_parent = subR;

这一段代码完成了subRparent之间的链接,由于parent可能还有父节点,所以我们先把parent的父节点ppNode保存下来,后续完成subRppNode链接。

if (parent == _root)
{
    _root = subR;
    subR->_parent = nullptr;
}
else
{
    if (ppNode->_left == parent)
        ppNode->_left = subR;
    else
        ppNode->_right = subR;

    subR->_parent = ppNode;
}

这一段代码,完成了ppNodesubR之间的链接,但是如果parent原先是_root节点的话,那么ppNode就是空指针,此时直接把_root更新为subR即可。
如果parent不是_root,那么直接进行链接即可,由于不确定parent原先是ppNode的左子树还是右子树,所以链接前需要检测一下。

parent->_bf = 0;
subR->_bf = 0;

这段代码则是完成平衡因子的更新,左单旋后,parentsubR的平衡因子都变成0

以下是一个左单旋的示例:

请添加图片描述


右单旋

右单旋与左单旋同理,此处直接放出动图与代码:

//右单旋
void RotateR(Node* parent)
{
    Node* subL = parent->_left;
    Node* subLR = subL->_right;

    parent->_left = subLR;
    if (subLR)
        subLR->_parent = parent;

    subL->_right = parent;
    Node* ppNode = parent->_parent;
    parent->_parent = subL;

    if (parent == _root)
    {
        _root = subL;
        subL->_parent = nullptr;
    }
    else
    {
        if (ppNode->_left == parent)
            ppNode->_left = subL;
        else
            ppNode->_right = subL;

        subL->_parent = ppNode;
    }

    parent->_bf = 0;
    subL->_bf = 0;
}

以下是一个右单旋的示例:
请添加图片描述


我们现在还有两种失衡没有解决:
在这里插入图片描述

对于这种失衡,我们需要用到双旋算法:左右双旋右左双旋


左右双旋

当AVL树出现LR失衡,我们就需要用到左右双旋LR失衡又分为以下两种情况:
在这里插入图片描述

也就是对subLR进行了再细分,到底新节点插入了左子树还是右子树。那么我们先展示一下左右双旋的过程:

那为什么subLR到达顶部之后,也可以保持稳定呢?
可以看到,在subLR向上走的过程中,分别把左右子树交给了parentsubL,而parentsubL原先都有一个高度为h-1的子树,而subLR旋转过程中移交给parentsubL的子树高度分别是h-1h-2,它们都低于h-1移交过程中不会影响subLparent的高度,而这两个节点最后分别成为了subLR的左右子树,所以subLR的左右子树最后高度一定都是h-1。因此subLR平衡因子一定为0

现在我们来完成代码:

//右左单旋
void RotateRL(Node* parent)
{
    RotateR(parent->_right);
    RotateL(parent);
    //更新平衡因子
}

现在的问题就是,要如何更新平衡因子?

可以看到,整体上有三种情况,三种情况对应的平衡因子最后都不同,所以我们要分类讨论。三种情况的区别在于:第一种情况subLR的平衡因子为-1,第二种情况subLR的平衡因子为1,第三种情况subLR的平衡因子为0

这样我们就可以写出以下代码:

//左右双旋
void RotateLR(Node* parent)
{
    Node* subL = parent->_left;
    Node* subLR = subL->_right;

    int bf = subLR->_bf;
    RotateL(parent->_left);
    RotateR(parent);

    if (bf == -1)
    {
        subLR->_bf = 0;
        subL->_bf = 0;
        parent->_bf = 1;
    }
    else if (bf == 1)
    {
        subLR->_bf = 0;
        subL->_bf = -1;
        parent->_bf = 0;
    }
    else if (bf == 0)
    {
        subLR->_bf = 0;
        subL->_bf = 0;
        parent->_bf = 0;
    }
    else
    {
        assert(false);
    }
}

以下是一个左右双旋示例:

请添加图片描述


右左双旋

代码如下:

//右左双旋
void RotateRL(Node* parent)
{
    Node* subR = parent->_right;
    Node* subRL = subR->_left;

    int bf = subRL->_bf;
    RotateR(parent->_right);
    RotateL(parent);

    if (bf == -1)
    {
        subR->_bf = 1;
        subRL->_bf = 0;
        parent->_bf = 0;
    }
    else if (bf == 1)
    {
        subR->_bf = 0;
        subRL->_bf = 0;
        parent->_bf = -1;
    }
    else if (bf == 0)
    {
        subR->_bf = 0;
        subRL->_bf = 0;
        parent->_bf = 0;
    }
    else
    {
        assert(false);
    }
}

以下是一个右左双旋示例:
请添加图片描述


总代码展示

由于插入操作已经可以很好的理解AVL控制平衡的手段了,此处就不讲解erase操作了,总代码如下:

AVLTree.h

#pragma once
#include <iostream>
#include <assert.h>
using namespace std;

template<class K, class V>
struct AVLTreeNode
{
    AVLTreeNode* _left;
    AVLTreeNode* _right;
    AVLTreeNode* _parent;
    int _bf; // balance factor
    pair<K, V> _kv;

    AVLTreeNode(const pair<K, V>& kv)
        : _left(nullptr)
        , _right(nullptr)
        , _parent(nullptr)
        , _bf(0)
        , _kv(kv)
    {}
};

template<class K, class V>
class AVLTree
{
    typedef AVLTreeNode<K, V> Node;
public:
    bool Insert(const pair<K, V>& kv)
    {
        if (_root == nullptr)
        {
            _root = new Node(kv);
        }

        Node* cur = _root;
        Node* parent = nullptr;

        while (cur)
        {
            if (cur->_kv.first < kv.first)
            {
                parent = cur;
                cur = cur->_right;
            }
            else if (cur->_kv.first > kv.first)
            {
                parent = cur;
                cur = cur->_left;
            }
            else
            {
                return false;
            }
        }

        cur = new Node(kv);

        if (parent->_kv.first > kv.first)
            parent->_left = cur;
        else
            parent->_right = cur;

        cur->_parent = parent;

        while (parent)//最坏情况一直更新到root,此时parent为nullptr
        {
            if (cur == parent->_left)//更新平衡因子
                parent->_bf--;
            else
                parent->_bf++;

            if (parent->_bf == 0)
            {
                break;
            }
            else if (parent->_bf == 1 || parent->_bf == -1)//向上查找,检测是否出现不平衡
            {
                cur = cur->_parent;
                parent = parent->_parent;
            }
            else if (parent->_bf == 2 || parent->_bf == -2)
            {
                //旋转
                if (parent->_bf == 2 && cur->_bf == 1)//2,1说明右边子树深度阶梯式增加,所以往左旋转
                    RotateL(parent);//左单旋
                else if (parent->_bf == -2 && cur->_bf == -1)//-2,-1说明左边子树深度阶梯式增加,所以往右旋转
                    RotateR(parent);//右单旋
                else if (parent->_bf == -2 && cur->_bf == 1)//-2, 1说明左边子树中间深,先左单旋提高中间节点,再右单旋提高中间节点
                    RotateLR(parent);
                else if (parent->_bf == 2 && cur->_bf == -1)//2, -1说明右边子树中间深,先右单旋提高中间节点,再左单旋提高中间节点
                    RotateRL(parent);
                else
                    assert(false);

                break;
            }
            else //说明插入前AVL出现了问题,直接报错
            {
                assert(false);
            }
        }

        return true;
    }

    //左单旋
    void RotateL(Node* parent)
    {
        Node* subR = parent->_right;
        Node* subRL = subR->_left;

        parent->_right = subRL;
        if (subRL)
            subRL->_parent = parent;

        subR->_left = parent;
        Node* ppNode = parent->_parent;
        parent->_parent = subR;

        if (parent == _root)
        {
            _root = subR;
            subR->_parent = nullptr;
        }
        else
        {
            if (ppNode->_left == parent)
                ppNode->_left = subR;
            else
                ppNode->_right = subR;

            subR->_parent = ppNode;
        }

        parent->_bf = 0;
        subR->_bf = 0;
    }

    //右单旋
    void RotateR(Node* parent)
    {
        Node* subL = parent->_left;
        Node* subLR = subL->_right;

        parent->_left = subLR;
        if (subLR)
            subLR->_parent = parent;

        subL->_right = parent;
        Node* ppNode = parent->_parent;
        parent->_parent = subL;

        if (parent == _root)
        {
            _root = subL;
            subL->_parent = nullptr;
        }
        else
        {
            if (ppNode->_left == parent)
                ppNode->_left = subL;
            else
                ppNode->_right = subL;

            subL->_parent = ppNode;
        }

        parent->_bf = 0;
        subL->_bf = 0;
    }

    //左右双旋
    void RotateLR(Node* parent)
    {
        Node* subL = parent->_left;
        Node* subLR = subL->_right;

        int bf = subLR->_bf;
        RotateL(parent->_left);
        RotateR(parent);

        if (bf == -1)
        {
            subLR->_bf = 0;
            subL->_bf = 0;
            parent->_bf = 1;
        }
        else if (bf == 1)
        {
            subLR->_bf = 0;
            subL->_bf = -1;
            parent->_bf = 0;
        }
        else if (bf == 0)
        {
            subLR->_bf = 0;
            subL->_bf = 0;
            parent->_bf = 0;
        }
        else
        {
            assert(false);
        }
    }

    //右左双旋
    void RotateRL(Node* parent)
    {
        Node* subR = parent->_right;
        Node* subRL = subR->_left;

        int bf = subRL->_bf;
        RotateR(parent->_right);
        RotateL(parent);

        if (bf == -1)
        {
            subR->_bf = 1;
            subRL->_bf = 0;
            parent->_bf = 0;
        }
        else if (bf == 1)
        {
            subR->_bf = 0;
            subRL->_bf = 0;
            parent->_bf = -1;
        }
        else if (bf == 0)
        {
            subR->_bf = 0;
            subRL->_bf = 0;
            parent->_bf = 0;
        }
        else
        {
            assert(false);
        }
    }
    
    //中序
    void InOrder()
    {
        _InOrder(_root);
        cout << "end" << endl;
    }
    
private:
    //中序
    void _InOrder(Node* root)
    {
        if (root == nullptr)
            return;

        _InOrder(root->_left);
        cout << root->_kv.first << " - ";

        _InOrder(root->_right);
    }
    
    Node* _root = nullptr;
};

举报

相关推荐

0 条评论