树(Tree)
名词解释
节点: 每个元素
父子关系: 用来连线相邻节点之间的关系
父节点: A节点就是B节点的父节点
子节点: B节点就是A节点的子节点
兄弟节点: B、C、D这三个节点的父节点是同一个节点
根结点: 没有父节点的节点
叶子结点: 没有子节点的节点
节点的高度: 节点到叶子结点到最长路径(边数) (计数起点为0, 从下往上)
节点的深度: 根节点到这个节点经历过的边个数 (计数起点为0, 从上往下)
节点的层数: 节点到深度 + 1 (计数起点为1)
树的高度: 根节点的高度
二叉树(Binary Tree)
特点
最常用的树数据结构
每个节点最多有两个子节点(左子节点、右子节点)
满二叉树: 叶子节点全都在最底层,除了叶子节点之外,每个节点都有左右两个子节点
完全二叉树: 叶子节点都在最底下两层,最后一层的叶子节点都靠左排列,并且除了最后一层,其他层的节点个数都要达到最大
二叉树存储方式
数组顺序存储法
通过数组下标来顺序存储数据 (i表示当前节点深度,从0开始)
根节点: i = 1,左节点:2 * i,右节点: 2 * i + 1,父节点: i / 2
完全二叉树采用此方式节省内存空间
链式存储法
每个节点需要存储三分数据:当前节点数据、左节点指针、右节点指针,比较占用空间
遍历
常用方式
前序遍历: 树任意节点,先打印当前节点,再打印它的左子树,最后打印它的右子树
中序遍历: 树任意节点,先打印它的左子树,再打印当前节点,最后打印它的右子树
后序遍历: 树任意节点,先打印它的左子树,再打印它的右子树,最后打印当前节点
二叉树的前、中、后序遍历就是一个递归的过程
时间复杂度是O(n)
每个节点最多被访问两次,遍历操作的时间复杂度跟节点的个数n成正比
二叉查找树(Binary Search Tree)
特点
二叉查找树为实现快速查找而生,支持快速查找一个数据、快速插入、快速删除一个数据
特殊结构: 其左子树每个节点的值 < 树的任意一个节点的值 < 其右子树每个节点的值
1.查找操作
先取根节点,如果它等于要查找的数据,那就返回。
如果要查找的数据比根节点的值小,那就在左子树中递归查找;
如果要查找的数据比根节点的值大,那就在右子树中递归查找
2.插入操作
一般插入的数据在叶子节点上,从根节点开始依次比较要插入的数据和节点的大小关系
如果插入数据比节点的数值大,并且节点的右子树为空,将新数据插到右子节点位置;
如果不为空,就再递归遍历右子树,查找插入位置。
如果插入数据比节点的数值小,并且节点的左子树为空,将新数据插到左子节点位置;
如果不为空,就再递归遍历左子树,查找插入位置。
3.删除操作
针对要删除节点的子节点个数的不同,需分三种情况来处理
1.如果要删除的节点没有子节点,步骤如下: (如图中的删除节点55)
只需将父节点中指向要删除节点的指针置为null
2.如果要删除的节点只有一个子节点,步骤如下: (如图中删除节点13)
只需将父节点中指向要删除节点的指针,让它指向要删除节点的子节点即可
3.如果要删除的节点有两个子节点,步骤如下: (如图中的删除节点18)
首先,需要找到这个节点的右子树中的最小节点,把它替换到要删除的节点上;
然后,再删除掉这个最小节点,因为最小节点肯定没有左子节点
删除操作,有个优化方案: 就是单纯将要删除的节点标记为“已删除”,
这种方案删除操作就变简单很多,但是比较浪费内存空间
其他操作
支持快速地查找最大节点和最小节点、前驱节点和后继节点
另外一种重要特性:
中序遍历二叉查找树,可以输出有序的数据序列,时间复杂度为O(n)
因此,二叉查找树也叫作二叉排序树
支持重复数据的二叉查找树
以上几种操作都默认树中节点存储的都是数字,而且都是不存在键值相同的情况
实际应用场景中采用对象的某个字段作为键值来构建二叉查找树,其他字段称为卫星数据
如果存储的两个对象键值相同,两种解决方案
1.把值相同的数据都存储在同一个节点(采用链表或支持动态扩容的数组等数据结构)
2.每个节点只存储一个数据,把这个新插入的数据当作大于这个节点的值来处理,如下图:
查找操作
当查找数据时遇到值相同的节点,继续在右子树中查找,直到遇到叶子节点才停止。
这样就把键值等于要查找值的所有节点都查找出来
删除操作
先查找到每个要删除的节点,然后再按前面讲的删除操作的方法,依次删除
时间复杂度分析
对于同一组数据可构造不同二叉查找树。查找、插入、删除操作的执行效率都不一样
图最左边树,根节点的左右子树极度不平衡,退化成链表,查找时间复杂度为O(n)
最理想的情况,二叉查找树是一棵完全二叉树(或满二叉树)
时间复杂度都跟树的高度成正比,也就是O(height)
树的高度就等于最大层数减一,为了方便计算,我们转换成层来表示
满二叉树: 下一层节点个数是上一层的2倍,第K层包含节点个数就是2^(K-1)
完全二叉树: 假设最大层数是L,总的节点个数n,它包含的节点个数在1个到2^(L-1)个之间
L的范围是[, +1],完全二叉树的高度小于等于
极度不平衡的二叉查找树,它的查找性能肯定不能满足我们的需求
平衡二叉查找树: 树的高度接近logn,时间复杂度较稳定为O(logn)
散列表 VS 二叉树
1.排序对比
散列表中的数据是无序存储的,如果要输出有序的数据,需要先进行排序
二叉查找树只需要中序遍历,就可以在O(n)的时间复杂度内,输出有序的数据序列
2.性能稳定性对比
散列表扩容耗时很多,而且当遇到散列冲突时,性能不稳定
最常用的平衡二叉查找树的性能非常稳定,时间复杂度稳定在O(logn)
3.时间复杂度对比
散列表查找等操作时间复杂度是常量级,因存在哈希冲突,这个常量不一定比logn小
另外加上哈希函数的耗时,也不一定就比平衡二叉查找树的效率高
4.结构设计对比
散列表构造比较复杂,需要考虑:散列函数设计、冲突解决办法、扩容、缩容等
平衡二叉查找树只需要考虑平衡性,而且目前这个的解决方案较成熟、固定
5.空间复杂度
散列表: 避免过多散列冲突,装载因子不能太大,特别基于开放寻址法,否则浪费太多空间