树(下)
堆
优先队列:特殊的“队列”,取出元素的顺序是一招元素的“优先权(关键字)”大小,而不是队列的先后顺序。
这种优先队列的使用场景类似于,操作系统的进程调度,重要的操作就是选出一个优先级最大的任务进行执行,或者删除一个优先级最大或者最小的任务。
所以,为了这一类任务,高效率的执行,有了堆
定义:
- 这种优先级的操作,可以使用数组链表等方法来做,一个更好的办法是用一个完全二叉树。
- 树的根节点是最大值(最小值),子树同样有这个规律。称之为大堆(小堆)
堆里边重要的操作:创建,插入,删除(选出)
删除:可以称之为选出,选出一个优先级最大的,所以对于堆来说,每次选出的跟定是根节点。根节点删除后,为了保持完全二叉树的结构,将最后一个叶子节点,移动到根节点位置
然后,依次次和孩子节点比较,用较大(较小)的孩子节点交换位置。
创建:
- 方法1:用插入操作将一个个元素,不停的插入到初始堆中去。时间复杂度O(n*long(n))
- 方法2:先按输入顺序存入,满足二叉树的结构特性,然后再调整位置,满足有序性。O(n)
哈夫曼树(最有二叉树)
为什么要用哈夫曼树
目标是为了,构造更有效率的搜索树/查找树。比如:百分制成绩转为等级制,判定条件的先后顺序,可以决定查找效率的高低,先判断人数分布比较多的分段,必然比
先判断人数分布少的分段效率高。
哈夫曼树使得根到每个叶子节点的带权(叶子节点带权/频率)路径之和最小
创建
每次把最小的两个二叉树合成为新二叉树O(n*log(n))
哈夫曼树的特点:
- 没有度为1的节点。
- 叶节点n个则,总共的节点数是2n-1.
- 左右子树仍然是哈夫曼树。
- 对于同一组权值,可能构成两个不同的哈夫曼树,但是最终的最小权值肯定是一样的。
哈夫曼编码
不等长编码避免二义性:任何一个编码都不应该是另一个编码的前缀。
在哈夫曼树中,可定不会有二义性,任何一个字符都位于叶子节点上,不会成为其他字符的前缀。
集合运算
合并查找