二叉排序、搜索树:BST
(一) 定义 & 特点
(二) 二叉查找数的查找
(三) 二叉查找数的遍历
(四)二叉查找树的插入与创建
(五)二叉查找树的删除
(六)支持重复数据的二叉查找树
(七)二叉查找树的复杂度
(八)二叉查找树和Hash表对比
(九)二叉查找树的其他操作
(十) 平衡二叉树AVL
-----------------------------------
 (一)二叉查找树的概念以及类型定义,特点:
(1)定义 
 二叉查找树为空树,或者满足以下条件:
 1.左子树非空,则左子树上所有记录均小于根节点的记录;
 2.右子树非空,则右子树上所有记录均大于根节点的记录;
 3.左右子树又是一棵二叉查找树。
 (2)类型定义:
 typedef struct node{
     DataType data;
     node* lchild, * rchild;
 }BSTNode;
 (3)特点:
 中序遍历二叉查找树,得到一个递增的有序序列;
(二)二叉查找树的查找
 (1)递归:
BSTNode* bstSearch(BSTNode* root, DataType k){
      if(root==NULL) 
           return NULL;
      if(root->data==k) 
           return root;
      else if(k<root->data) //在左子树中查找
          return bstSearch(root->lchild,k);
      else if(k>root->data)//在右子树中查找
          return bstSearch(root->rchild,k);
 }
 (2)非递归:/*
 在以root为根节点的二叉排序树中查值为x的节点,father保存的是所查节的父节点;
 father为引用型参数
 */BSTNode* bstSearch(BSTNode* root ,DataType x, BSTNode* & father)
 {
     BSTNode* pnode=root;
     father=NULL;    while(pnode!=NULL && x!=pnode->data){
         father=pnode;
         if(x<pnode->data)
             pnode=pnode->lchild;
         else 
             pnode=pnode->rchild;
     }//没有找到,循环结束则pnode==NULL,father为值很接近data的叶子节点;
     return pnode;
 }(三)二叉查找树的遍历:
 略
 (四)二叉查找树的插入与创建:
(1)插入:
 注意:新节点都是作为叶子节点插入的,所以树是向下生长的。
/*
目的:在以root为根节点的二叉排序树中插入一个值为x的节点,插入成功返回1,否则0;
注意:root为引用型参数;
思想:若原二叉查找树为空,则直接插入节点作为根节点;
若x小于根节点的data,则插在左子树中,否则右子树中。
*/
int bstInsert(BSTNode* & root, DataType x){
if(NULL==root) {
root=(BSTNode* )malloc(sizeof(BSTNode));
root->data=x;
root->lchild=root->lchild=NULL;
return 1;
}
else if(root->data == x) {//如果二叉查找树中已经存在值为x的节点,则失败。
return 0;
} else if(x<root->data) {//插入到左子树中。
return bstInsert(root->lchild,x);
}
else
bstInsert(root->rchild,x);
}
或者:非递归方法:
int bstInsert(BSTNode* & root,DataType x){
      BSTNode* pnode,*newNode,*father;
      pnode=bstSearch(root,x,father);
      //调用上面的非递归的查找
      //如果找到则pnode非空,没有找到则pnode为空,father为值很接近x的叶子节点。     if(pnode!=NULL )//已经存在值为x的节点
         return 0;     newNode=(BSTNode* )malloc(sizeof(BSTNode));
      newNode->data=x;
      newNode->lchild=newNode->rchild=NULL;     if(NULL==father) //如果原二叉查找树为空
         root=newNode;     else if(x<father->data)
         father->lchild=newNode;
      else  
         father->rchild=newNode;
      return 1;
 }(2)二叉查找树的构造:
void createBST(BSTNode* & root ,DataType[] dataArray, int length)
{
root=NULL;
for(int i=0;i<length;i++)
bstInsert(root,dataArray[i]);
}
 (五)二叉查找树的删除:
二叉查找树中删除一个节点,不能把以该节点为根的子树都删除,删除二叉查找树的一个节点就相当于删除有序序列中的一个元素。
设:被删除的节点为pnode,father为其父节点,分为四种情况:
 (1)pnode为叶子节点:
 直接删除pnode.
 (2)pnode为左单分支节点:
 pnode只有左子树,而没有右子树。
 将pnode的左子树直接代替pnode。
 (3)pnode为右单分支节点:
 将pnode的右子树直接代替pnode。
 (4)pnode为双分支节点:
 1)方法一:
 将pnode的左子树的最右节点与pnode交换,(pnode的左子树的最右节点没有右孩子),采用情况2删除左子树的最右节点。
 2)方法二:
 将pnode的右子树的最左节点与pnode交换,(pnode的右子树的最左节点没有左孩子),采用情况3删除右子树的最左节点。
 代码实现:
 
/*
目的:在以root为根节点的二叉查找树中删除值为x的节点,成功则返回1,否则返回0;
注意:root为引用型参数,因为root也可能被删除。
*/int bstDelete(BSTNode* &root , DataType x ){
BSTNode* father,*node_x; node_x=bstSearch(root,x,father); //调用上面的非递归的search
if(node_x==NULL)
return 0;//没有该节点。 BSTNode* temp_nodeX=node_x; //保存node_x的值;
if(NULL==node_x->rchild) //右孩子为空,为左单分支节点
{
node_x=node_x->lchild;
} else if(NULL==node_x->lchild) //左孩子为空,为右单分支节点
{
node_x=node_x->rchild;
delete temp_nodeX;
return 1;
} else { //node_x为双分支节点
BSTNode* pnode=node_x->lchild;
father=node_x;
//寻找node_x的左子树的最右节点,father为其父节点;
while(pnode->rchild!=NULL)
{
father=pnode;
pnode=pnode->rchild;
} node_x->data=pnode->data;//将node_x的左子树的最右节点的值保存在node_x中
//删除node_x的左子树的最右节点
if(father==node_x)
father->lchild=pnode->lchild;
else
father->rchild=pnode->lchild; delete pnode;
return 1;
}}
------
(六) 支持重复数据的二叉查找树
前面讲二叉查找树的时候,我们默认树中节点存储的都是数字。很多时候,在实际的软件开发中,我们在二叉查找树中存储的是一个包含很多字段的对象。我们利用对象的某个字段作为键值(key)来构建二叉查找树。
前面我们讲的二叉查找树的操作,针对的都是不存在键值相同的情况。那如果存储的两个对象键值相同,这种情况该怎么处理呢?这里有两种解决方法。
重复数据的二叉查找数的处理方法:
(6.1)二叉查找树的每个节点为数组或者链表:
二叉查找树中每一个节点不仅会存储一个数据,因此我们通过链表和支持动态扩容的数组等数据结构,把值相同的数据存储在同一个节点上。
(6.2)树中存在和要插入数据key相同的数据时,将这个要插入的数据放到这个节点的右子树中;
所以:当要查找、删除数据时,遇到值相同的节点,并不能停止查找,而是继续在右子树中查找,直到遇到叶子节点。
------
(七)二叉查找树的复杂度
最糟糕的情况, 当二叉查找树根节点的左右子树极度不平衡时,就退化成了链表,所以查找时间复杂度就变成了 O(n)。
最理想的情况,二叉查找树是一棵完全二叉树,这个时候插入、删除、查找的时间复杂度是 O(height),差不多O(lgn)。
显然,极度不平衡的二叉查找树,它的查找性能肯定不能满足我们的需求。我们需要构建一种不管怎么删除、插入数据,在任何时候,都能保持任意节点左右子树都比较平衡的二叉查找树,这就是我们下一节课要详细讲的,一种特殊的二叉查找树,平衡二叉查找树。平衡二叉查找树的高度接近 logn,所以插入、删除、查找操作的时间复杂度也比较稳定,是 O(logn)。
-----
(八)二叉查找树和Hash表对比
散列表那节中讲过,散列表的插入、删除、查找操作的时间复杂度可以做到常量级的 O(1),非常高效。
而二叉查找树在比较平衡的情况下,插入、删除、查找操作时间复杂度才是 O(logn),相对散列表,好像并没有什么优势,那我们为什么还要用二叉查找树呢?我认为有下面几个原因:
(1)数据有序性
散列表中的数据是无序存储的,如果要输出有序的数据,需要先进行排序。而对于二叉查找树来说,我们只需要中序遍历,就可以在 O(n) 的时间复杂度内,输出有序的数据序列。
(2)性能稳定性
散列表扩容耗时很多,而且当遇到散列冲突时,性能不稳定,尽管二叉查找树的性能不稳定,但是在工程中,我们最常用的平衡二叉查找树的性能非常稳定,时间复杂度稳定在 O(logn)。
所以:
散列表的构造比二叉查找树要复杂,需要考虑的东西很多。比如散列函数的设计、冲突解决办法、扩容、缩容等。平衡二叉查找树只需要考虑平衡性这一个问题,而且这个问题的解决方案比较成熟、固定。
综合这几点,平衡二叉查找树在某些方面还是优于散列表的,所以,这两者的存在并不冲突。我们在实际的开发过程中,需要结合具体的需求来选择使用哪一个。
------
(九)二叉查找树的其他操作
-----
(十)二叉平衡树:AVL
 (1)定义:
 高度平衡的二叉查找树为AVL树,即左右子树高度差的绝对值小于等于1的二叉查找树。
 (2)节点的平衡因子:bf
 节点 的平衡因子为该节点的左子树的高度减去右子树的高度,所以AVL树的所有节点的平衡因子为-1,0,或1.
 (3)AVL树的节点的类型定义:
typedef struct AVLNode{
      DataType data;
      AVLNode* lchild, *rchild;
      int bf;//平衡因子
 }(4)完全二叉树是高度平衡的,但是它不一定满足二叉查找树的定义。










