优先队列
支持删除最大元素和插入元素两种操作的数据结构可以称之为优先队列。
可以用无序数组|有序数组(下压栈), 链表实现优先队列(PQ).
- 有序数组:保证数组有序,最大的元素在栈顶,删除即是pop
- 无序数组:数组无序。删除操作:将栈顶元素和最大元素交换位置后pop
堆
在二叉堆的数组中,每个元素都要保证大于等于另两个指定位置的元素,相应的,这些位置的元素至少大于等于数组中的两个元素,以此类推。
当一棵二叉树的每个结点都大于等于它的两个子结点时,它被称为堆有序.
root结点是堆有序二叉树中的最大元素。
二叉堆表示法
如果用指针表示,则每个结点需要3个指针(父和子x2)。我们使用完全二叉树,表达就会变得特别方便。用数组表示的具体做法是按照层级顺序将结点放入数组中,root在结点1,root的子结点在2,3,接下来是4567,依次类推。
二叉堆是一组能够用堆有序的完全二叉树排序的元素,并在数组中按层级顺序排列(不使用第一个数组的第一个位置,原因见下)
在一个堆中,位置k的结点的父结点位置为floor(k/2),它的子结点是2k,2k+1.这样我们就能够在不使用指针的情况下,通过计算数组的索引在树中移动,向上一层就令k=k/2,向下一层就2k或2k+1.
用堆我们将能实现对数级别的插入元素和删除最大元素。
命题P:一棵大小为N的完全二叉树的高度为floor(lgN)
堆的算法
堆的有序化:堆的操作会首先进行一些简单的改动,打破堆的状态,然后再遍历堆并按要求将堆的状态恢复,this is so-called reheapifying.
堆的reheapifying中我们会遇到两种情况:
- 当某个结点的优先级上升(或是在堆底添加一个新元素),我们需要从下向上恢复堆(上浮)
- 当优先级下降,我们需要从上向下恢复堆(下沉)
上浮(swim)
如果堆的有序状态因为某个结点变得比它的父结点大而被打破,我们需要通过交换它和它的父结点来修复堆。交换后,这个结点比它的两个子结点要大(原因:1.2.),但不可忽视的是,这个结点仍有可能比它当前的父结点要大,因此需要一步步上浮,直到它比父结点小(类似于冒泡)
下沉(sink)
如果堆的有序状态因为某个结点变得比它的两个子结点或是其中之一小而被打破,那么我们可以将它和它的两个子结点中的较大值交换来恢复堆。一直sink直到它比两个子结点都要大为止。
插入元素
我们将新元素加在数组的末尾,然后将这个元素一直上浮直到合适的位置
删除最大的元素
我们从数组顶端删除并将数组的最后一个元素放在根的位置,再将这个元素一直下沉至合适的位置.
如上两个操作用时在LgN级别,相比用无序|有序数组实现的优先队列优良。
命题Q:对于一个含有N个元素的基于堆的优先队列,插入元素操作只需不超过lgN+1次比较,删除最大元素的操作需要不超过2LgN次比较.
多叉堆
位置k的结点总是大于等于位于3k-1,3k,3k+1,小于等于位于floor((k+1)/3).实现d叉树也不困难。我们需要在树高(Logd N)和在每个结点的子结点中找到最大者的代价之间衡量。
堆排序
先用待排序的数组构建一个堆(从一半的位置开始sink),然后每次将根结点(即当前树的最大元素)和数组的末尾元素交换位置,这样最大的元素就归位了,再让该末尾sink到合适的位置,接下来对除了归位元素的剩下元素进行重复的操作。递归到只剩一个元素的时候,就已经排好序了。
性能
将N个元素排序,堆排序只需少于2NLgN+2N次比较,以及一半次数的交换
改进
1.先下沉后上浮
在下沉中总是直接提升较大的子结点直至到达堆底,然后再使元素上浮到正确的位置。在实际应用中,只有当比较操作代价较高时才有用(如长字符串)
特点
堆排序是我们所知的唯一能够同时最优利用空间和时间的方法,在最坏的情况下它也能保证使用~2NLgN次比较和恒定的额外空间。当空间紧张时,如嵌入式和低成本的移动设备上,它只用几行就能实现较好的性能,当现代操作系统的许多应用中很少用它,因为它无法利用缓存。数组元素很少和相邻的元素比较,因此缓存未命中的次数要远远高于大多数在相邻元素间进行的算法。
答疑
1.为什么要从数组第二个位置开始使用?
- 简化计算
- 让a[0]作为哨兵,作为a[1]的父结点