大家好,我是“Stephen·谢”,今天讲一下关于数据结构“堆”以及“堆排序”算法的相关内容。
“堆结构”
前面的好几篇文章都讲到了树的结构,今天要讲的“堆”其实也是树结构的一种,我们看下图:
很明显,我们发现它们都是“二叉树”,并且还是“完全二叉树”,左图中根节点是所有元素中最大的,右图中根节点是所有元素中最小的,左图中每个节点都比它左右孩子要大,右图中每个节点都比它左右孩子要小。这便是我们要讲的“堆”结构。
堆结构中,每个节点的值都大于或等于其左右孩子节点的值称为“大顶堆”,每个节点的值都小于或等于其左右孩子节点的值称为“小顶堆”。
注意,根节点一定是堆中所有节点最大(小)者,较大(小)的节点靠近根节点。(但也不绝对,如右图小顶堆中60、40均小于70,但他们并没有比70更靠近根节点)
我们如果按照“层序遍历”的方式给节点从1号开始编号,则节点之间满足以下关系:
此公式一定要看懂,一定要理解i,2i,2i+1,[n/2]对于堆结构而言代表着什么。
“堆排序算法”
堆结构的根节点是最大或最小的这个特点给了我们灵感,我们或许可以利用堆的这个特点来进行排序的实现。
堆排序(Heap Sort)就是利用堆(假设利用大顶堆)进行排序的方法。它的基本思想是:将待排序的序列构成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点,再将它移走(其实就是将其与堆数组的末尾元素交换,此时末尾元素就是最大值),然后将剩余的n-1个序列重新构造成一个大顶堆,这样就会得到这n个元素中的次小值。如此反复执行,便能得到一个有序序列了。
上面图例中对堆排序思想的展示再清晰不过了。不过现实中我们需要解决两个问题,第一:如何由一个无序序列构建成一个堆;第二:如何在得到堆顶元素后,调整剩余的元素成为一个新的堆。
上代码截图:
从代码中可以看出,整个排序过程分为两个循环,第一个循环要完成的就是将现在的待排序序列构建成一个大顶堆,第二个循环要完成的就是逐步将每个最大值的根节点与末尾元素交换,并再调整其成为一个大顶堆。用动态图形象地表示如下:
解释一下无非就两点:
1、 从下往上,从右往左地顺序查找每个非叶子结点,对比子结点,与最大结点交换位置,交换的新位置再与其子结点比较、移动,遍历后最终找到最大值。
2、把堆顶和最后的元素交换位置,排除最后的位置,重复1步骤,找到遍历后的最大值,放到倒数第二的位置,依次直到结束。
堆排序复杂度分析
堆排序运行时间主要是消耗在初始构建堆和在重建堆时的反复筛选上。在构建堆的过程中,对每个终端节点最多进行两次比较操作,因此整个排序堆的时间复杂度为O(n)。在正式排序时,第i次取堆顶记录重建堆需要用O(logi)的时间,并需要取n-1次堆顶记录,因此总体来说,堆排序的时间复杂度为O(nlogn)。由于堆排序对原始数据的排序状态并不敏感,因此它无论是最好、最坏和平均时间复杂度均为O(nlogn)。在这性能上显然要远远好过于冒泡、选择、插入的O(n²)的时间复杂度了。
空间复杂度上,它只有一个用来交换的暂存单元,也是非常不错。不过由于记录的比较和交换是跳跃式进行,因此堆排序也是一种不稳定的排序方法。另外,由于初始构建堆排序需要的比较次数较多,因此,它不适合待排序序列个数较少的情况。