树是n(n >= 0)个结点的有限集。n=0时称为空树。在任意一颗非空树中:
1、有且仅有一个特定的称为根(Root)的结点;
2、当n>1时,其余结点可分为m(m >0)个互不相交的有限集T1、T2、....... 、Tm,其中每一个集合本身又是一颗树,并且称为根的子树(SubTree);
3、m>0时,子树的个数没有限制,但它们一定是互不相交的。
结点分类
结点拥有的子树数称为结点的度 (Degree) 。度为 0的结点称为叶结点(Leaf) 或终端结点;度不为0的结点称为非终端结点或分支结点。除根结点之外,分支结点也称为内部结点。树的度是树内各结点的度的最大值。下图这棵树结点的度的最大值是结点
D的度,为3,所以树的度也为3。
结点间关系
线性表和树的比较
树的存储结构
充分利用顺序存储和链式存储结构的特点,完全可以实现对树的存储结构的
表示。三种不同的表示法:双亲表示法、孩子表示法、孩子兄弟表示法。
双亲表示法
在每个结点中,附设 一个指示器指示其双亲结点到链表中的位置
这样的存储结构,我们可以根据结点的 parent 指针很容易找到它的双亲结点,所
用的时间复杂度为 O(1),直到 parent 为-1时,表示找到了树结点的根。可如果我们
要知道结点的孩子是什么,对不起,请遍历整个结构才行。
这真是麻烦,能不能改进一下呢?
当然可以。我们 增加一个结点最左边孩子的域,不妨叫包长子域,这样就可以很
容易得到结点的孩子。如果没有孩子的结点,这个长子域就设置为-1:
另外一个问题场景,我们很关注各兄弟之间的关系,双亲表示法无法体现这样的
关系,那我该怎么办?嗯,可以增加一个右兄弟域来体现兄弟关系,也就是说,每
个结点 如果它存在右兄弟,则记录下右兄弟的下标。同样的,如果右兄弟不存在,则赋值为 -1:
孩子表示法
每个结点有多个指针域,其中每个指针指向一棵子树的根结点,我们把这种方法叫做多重链表表示法
孩子表示法:把每个结点的孩子结点排列起来,以单链表作存储结构,则 n个结点有 n个孩子链表,如果是叶子结点则此单链表为空。然后那个指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。(怎么感觉和HashMap的原理很像)
双亲孩子表示法
二叉树
二叉树( Bina Tree) n(n >= 0) 个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
特点
- 每个结点最多有两棵子树,所以二叉树中不存在度大于2的结点。注意不是只有两棵子树,而是最多有。没有子树或者有一棵子树都是可以的
- 左子树和右子树是有顺序的,次序不能任意颠倒。就像人是双手、双脚,但显然左手、左脚和右手、右脚是不一样的,右手戴左手套、右脚穿左鞋都会极其别扭和受。
- 即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。
5中基本形态
- 空二叉树
- 只有一个根节点
- 根节点只有左子树
- 根节点只有右子树
- 根节点既有左子树又有右子树
特殊二叉树
- 斜树 :左斜树 &右斜树
- 满二叉树:在一颗二叉树中,如果所有分支结点都存在左子树和右子树,并且所有 叶子都在同一层上,这样的二叉树称为满二叉树
特点:- 叶子只能出现在最下一层。出现在其它层就不可能达成平衡。
- 非叶子结点的度一定是2 。否则就是"缺胳膊少腿" 了
-
在同样深度的二叉树中,满二叉树的结点个数最多,叶子数最多。
3.完全二叉树:对一棵具有 n个结点的二叉树按层序编号,如果编号为 i(l<= i <=n) 的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这棵 叉树称为完全二叉树。
满二叉树一定是完全二叉树,但完全二叉树不一定是满二叉树。可以理解为完全二叉树是满二叉树中截取的一部分。
特点:
1. 叶子结点只能出现在最下两层。
2. 最下层的叶子一定集中在左部连续位置
3. 倒数二层,若有叶子结点,一定都在右部连续位置。
4. 如果结点度为 1,则该结点只有左孩子,即不存在只有右子树的情况。
5. 同样结点数的 叉树,完全二叉树的深度最小。
二叉树的性质
在二叉树的第i层上最多有2^(i-1) 个节点 。(i>=1)
深度为k的二叉树至多有 2^k - 1个结点
-
对任何一颗二叉树 ,如果其终端结点数(叶子结点树)为n0,度为2 的结点数为n2,则n0=n2+1。
推导过程 根据两个公式:- n=n0+n1+n2 n表示二叉树中的节点总个数,n1表示度数为1的节点个数
- n-1=2n2+n1 通过观察二叉树我们可知,除了根节点之外,其余的任何节点都有一个入口分支,其他节点都有一个入口分支,那么节点的总分支数等于节点个数减一,度数为2的节点有2个出口分支,度数为一的有1个出口分支,度数为0的节点没有出口分支 所以总的分支个数为 2n2+n1
-
.在完全二叉树中,具有n个节点的完全二叉树的深度为[log2n]+1,其中[log2n]+1是向下取整。
若对含 n 个结点的完全二叉树从上到下且从左至右进行 1 至 n 的编号,则对完全二叉树中任意一个编号为 i 的结点:
(1) 若 i=1,则该结点是二叉树的根,无双亲, 否则,编号为 [i/2] 的结点为其双亲结点;
(2) 若 2i>n,则该结点无左孩子, 否则,编号为 2i 的结点为其左孩子结点;
(3) 若 2i+1>n,则该结点无右孩子结点, 否则,编号为2i+1 的结点为其右孩子结点。
二叉树的顺序存储结构
模拟二叉树存储结构:不存在得到结点用^代替
二叉树链表
二叉树每个结点最多有两个孩子,所以为她设计一个数据域和两个指针域
结构示意图
二叉树遍历
二叉树的遍历是指从根结点出发,按照某种次序依次访问二叉树中所有结点。使得每个结点被访问一次且仅被访问一次。
分类:
1.前序遍历:规则是若二叉树为空,则空操作返回,否则先访问根结点,然后前序遍历左子树,再前序遍历右子树。
2.中序遍历:规则是若树为空,则空操作返回,否则从根结点开始(注意并不是先访问根结点) ,中序遍历根结点的左子树,然后是访问根结点,最后中序遍历右子树。
3.后序遍历:规则是若树为空,则空操作返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后是访问根结点 。
4.层序遍历:规则是若树为空,则空操作返回,否则从树的第一层,也就是根结点开始访问,从上而下逐层遍历,在同一层中 ,按从左到右的顺序对结点逐个访问。
理由:对于计算机来说,它只有循环、判断等方式来处理出具,也就是说,它只会处理线性序列,而我们刚才提到的四种遍历方法,其实都是在把树中的结点变成某种意义的线性序列,这就给程序的实现带来了好处。
算法实现
前序遍历
void preOrderTraverse(Node N){
if(N == null)
return;
printf("%s",N.data);
preOrderTraverse(N.lchild);//先遍历左子树
preOrderTraverse(N.rchild);//再遍历又子树
}
中序遍历
void inOrderTraverse(Node N){
if(N == null)
return;
inOrderTraverse(N.lchild);//先遍历左子树
printf("%s",N.data);
inOrderTraverse(N.rchild);//再遍历又子树
}
后序遍历
void postOrderTraverse(Node N){
if(N == null)
return;
postOrderTraverse(N.lchild);//先遍历左子树
postOrderTraverse(N.rchild);//再遍历又子树
printf("%s",N.data);
}
二叉树的建立
#include<iostream>
using namespace std;
typedef struct node
{
struct node *leftChild;
struct node *rightChild;
char data;
}BiTreeNode, *BiTree;
void createBiTree(BiTree &T)
{
char c;
cin >> c;
if('#' == c)
T = NULL;
else
{
T = new BiTreeNode;
T->data = c;
createBiTree(T->leftChild);
createBiTree(T->rightChild);
}
}
int main()
{
BiTree T;
createBiTree(T);
return 0;
}
线索二叉树
**指向前驱和后继的指针称为线索,加上线索的二叉链表称为线索链衰,相应的二叉树就称为线索二叉树
**
如果所用的二叉树需经常遍历或查找结点时需要某种遍历序列中的前驱和后继,那么采用线索二叉链表的存储结构就是非常不错的选择
树的转换
将树转化为二叉树
- 加线。在所有兄弟结点之间加一条连线
- 去钱。对树中每个结点,只保留它与第一个孩子结点的连线,删除色与其他孩
子结点之间的连线。 - 层次调整。以树的根结点为轴心,将整棵树顺时针旋转一定的角度,使之结构
层次分明。注意第一个孩子是二叉树结点的左孩子,兄弟转换过来的孩子是结点的右孩子。
森林转化为二叉树
- 把每个树转换为二叉树
-
第一棵二叉树不动,从第二棵二叉树开始,依次把后一棵二叉树的根结点作为
前一棵二叉树的根结点的右孩子,用线连接起来。当所有的二叉树连接起来后就得到了由森林转换来的二叉树。
二叉树转换为树
- 加线。若某结点的左孩子结点存在,则将这个左孩子的右孩子结点、右孩子的
右孩子结点、右孩子的右孩子的右孩子结点…,反正就是左孩子的n个右孩子结点都作为此结点的孩子。将该结点与这些右孩子结点用线连接起来。 - 去钱。删除原二叉树中所有结点与其右孩子结点的连线。
-
层次调整。使之结构层次分明。
二叉树转换为森林
- 从根结点开始,若右孩子存在,则把与右孩子结点的连线删除,再查看分离后的二叉树,若右孩子存在,则连续删除除……,直到所有右孩子连线都删除为止,得到分离的二叉树。
-
再将每棵分离后的二叉树转换为树即可。
树与森林的遍历
树
- 先根遍历树,即先访问树的根结点,然后依次先根遍历根的每棵子树。
- 后根遍历,即先依次后根遍历每棵子树,然后再访问根结点。
森林
- 前序遍历: 先访问森林中第一棵树的根结点,然后再依次先根遍历根的每棵子树,再依放用同样方式遍历除去第一棵树的剩余树构成的森林。
- 后序遍历: 是先访问森林中第一棵树,后根遍历的方式遍历每棵子树,然后再
访问根结点,再依次同样方式遍历除去第一棵树的剩余树构成的森林。