1 树的定义
树(Tree)是个结点的有限集。
时称为空树。在
时称为空树。在任意一棵非空树种:①有且仅有一个特定的称为根(Root)的结点;②当n>1时,其余结点可分为m(m>0)个互不相交的有限集
,其中每一个集合本身又是一棵树,并且称为根的子树(SubTree),如图所示。
对于树的定义还需要注意两点:
时根节点是唯一的,不可能存在多根结点,别和现实中的大树混在一起,现实中的树有很多根须,那是真实的树,数据结构中的树是只能有一个根节点。
时,子树的个数没有限制,但它们一定是互不相交的。像下图中的两个结构就不符合树的定义,因为它们都有相交的子树。
2 结点的分类
树的结点包含一个数据元素及若干指向其子树的分支。结点拥有的子树数称为结点的度(Degree)。度为0的结点称为叶结点(Leaf)或终端结点;度不为0的结点称为非终端结点或分支结点。除根结点之外,分支结点也称为内部结点。树的度是树内各结点的度的最大值。
3 结点间的关系
结点的子树的根称为该结点的孩子(Child),相应地,该结点称为孩子的双亲(Parent)。同一个双亲的孩子之间互称兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点,反之以某结点为根的子树中的任一结点都称为该结点的子孙。在下图中,D、B、A都是H的祖先,B的子孙有D、G、H、I。
4 树的其他相关概念
结点的层次(Level)从根开始定义起,根为第一层,根的孩子为第二层。双亲在同一层的结点互为堂兄弟,在下图中D、E、F是堂兄弟。树中结点的最大层次称为树的深度(Depth)或高度。
如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则为无序树。
对比线性表与树的结构的区别如下图所示:
5 树的抽象数据类型
伪代码定义:
ADT 树(tree)
DATA
树的由一个根节点和若干棵子树构成的。树中结点具有相同数据类型及层次关系。
Operation
InitTree(*T):构造空树T。
DestoryTree(*T):销毁树T。
CreateTree(*T,definition):按definition中给出的树的定义来构造树。
ClearTree(*T):若树T存在,则将树T清为空树。
TreeEmpty(T):若树T为空树,返回true,否则返回false。
TreeDepth(T):返回T的深度。
Root(T):返回T的根结点。
Value(T,cur_e):cur_e是树T中一个结点,返回此结点的值。
Assign(T,cur_e,value):给树T的结点cur_e赋值为value。
Parent(T,cur_e):若cur_e是树T的非根结点,则返回它的双亲,否则返回空。
LeftChild(T,cur_e):若cur_e是树T的非叶结点,则返回它的左孩子,否则返回空。
RightSibling(T,cur_e):若cur_e有右兄弟,则返回它的右兄弟,否则返回空。
InsertChild(*T,*p,i,c):其中p指向树T的某个结点,i为所指结点p的度上加1,非空树c与T不相交,操作结 果为插入c为树T中p所指结点的第i个子树。
DeleteChild(*T,*p,i):其中p指向树T的某个结点,i为所指结点p的度,操作结果为删除T中p所指结点的第i 棵子树。
endADT
6 树存储结构
树的三种不同表示法:双亲表示法、孩子表示法、孩子兄弟表示法
6.1 双亲表示法
树这种结构除了根结点外,其余每个结点,它不一定有孩子,但是一定有且仅有一个双亲。
假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示器双亲结点在数组中的位置。也就是说,每个结点除了知道自己是谁,还需要知道它的双亲在哪里。它的结点结构如下:
双亲表示法的结点结构定义代码:
#define MAX_TREE_SIZE 100
typedef int TElemType;
typedef struct PTNode{ // 结点结构
TElemType data; // 结点数据
int parent; // 双亲位置
}PTNode;
typedef struct{
PTNode nodes[MAX_TREE_SIZE]; // 结点数组
int r,n; // 根的位置和结点树
}PTree
在树的结构中,根结点是没有双亲的,我们约定根结点的位置域设置为-1,下图中的树结构可用下表中的树双亲表示:
用这种表示方法,找到双亲结点的时间复杂度是,但是找到结点孩子的时间复杂度是
。
可以增加一个结点最左边孩子的域,就可以很容易得到结点的孩子,如果没有孩子的结点,这个长子域就设置为-1,如下表所示。
6.2 孩子表示法
由于树中每个结点可能有多棵子树,可以考虑用多重链表,即每个结点有多个指针域,其中每个指针指向一棵子树的根结点,我们把这种方法叫做多重链表表示法。不过,树的每个结点的度,也就是它的孩子个数是不同的。
孩子表示法,把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子链表,如果是叶子结点则此单链表为空。然后n个头结点又组成一个线性表,采用顺序存储结构,存放进一个一维数组中,如图所示。
设计两种结点结构,
- 一个是孩子链表的孩子结点,如图所示:
其中child是数据域,用来存储某个结点在表头数组中的下标;next是指针域,用来存储指向 某结点的下一个孩子结点的指针。
- 另一个是表头数组的表头数据,如图所示:
其中data是数据域,存储某结点的数据信息;firstchild是头指针域,存储该结点的孩子链表的头指针。
孩子表示法的结构定义代码:
#define MAX_TREE_SIZE 100
typedef int TElemType;
typedef struct CTNode{ // 孩子结点
int child; // 存储结点在表头数组中的下标
struct CTNode *next; // 存储指向下个孩子结点的指针
}CTNode;
typedef struct{ // 表头结构
TElemType data; // 存储数据信息
ChildPtr firstchild; //存储该结点的孩子链表的头指针
}CTBox;
typedef struct{ //树结构
CTBox nodes[MAX_TREE_SIZE]; // 结点数组
int r,n; // 根的位置和结点数
}PTree
这种表示方法对于我们查找某个结点的孩子或找某个结点的兄弟很方便,但是要知道结点的双亲是谁就比较麻烦,需要遍历整棵树。
我们可以把双亲表示法和孩子表示法综合下,如图所示。这种表示法称为双亲孩子表示法。
6.3 孩子兄弟表示法
任意—棵树,它的结点的第一个孩子如果存在就呈唯一的,它的右只弟如果存在也是唯一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。
结点结构如下:
其中,data是数据域,firstchild为指针域,存储该结点的第一个孩子结点的存储地址;rightsib是指针域,存储该结点的右兄弟结点的存储地址。
结构定义代码如下:
typedef struct CSNode{
TElemType data;
struct CSNode *firstchild,*rightsib;
}CSNode,*CSTree;
这种方法实现的示意图如图所示:
这种方法对于查找某个结点的某个孩子是特别方便的,但是想找某个结点的双亲,这个表示发也是有缺陷的,解决的方法就是可以再增加一个parent指针域来解决快速查找双亲的问题,这个表示法最大好处就是把一个复杂的树变成了一棵二叉树,如图所示。