前言
上一篇写了数据结构之二叉搜索树、AVL自平衡树,这次来写堆。
堆的创造者
很久以前排序算法的时间复杂度一直是O(n^2), 当时学术界充斥着“排序算法不可能突破O(n^2)”的声音,直到1959年,由D.L.Shell提出了一种排序算法,希尔排序(Shell Sort),才打破了这种不可能的声音,把排序算法的时间复杂度提升到了O(n^3/2)!
当科学家们知道这种"不可能"被突破之后,又相继有了更快的排序算法,“不可能超越O(n^2)”彻底成为了历史。
在1964年,没错,是55年前!堆排序这种奇思妙想的,十分精彩的,排序算法诞生了!时间复杂度为O(nlogn),远甩O(n^2)
由Robert W. Floyd(罗伯特·弗洛伊德)和J.W.J. Williams(威廉姆斯)共同发明了著名的堆排序,同时也发明了“堆”这样的数据结构, Floyd在1978年获得了图灵奖!真是个狼人!!(比很人还要多一点)
有时候了解下历史,也是十分有趣的!虽然你可能会觉得并没什么卵用~
堆是什么?
之前第一次听到堆这个词的时候,感觉像是一堆乱七八糟的东西,完全跟树连想不到一起,后来才知道,原来堆也是一颗二叉树,而且是完全二叉树
堆的性质:
堆中某个节点的值总是不大于或不小于其父节点的值;
堆总是一棵完全二叉树。
如何用数组表示堆?
我们可以把堆,存放在一个数组中,根据索引来获取节点,那么如何通过索引表示父子关系呢?
堆是一颗完全二叉树,所以满足如下条件
假如当前的节点索引为:k
父节点索引:(k-1) / 2
左孩子节点:2 * k + 1
右孩子节点:2 * k + 2
根据这个规律,我们就可以用索引来计算出父子节点的位置了。这样就能把堆存放在数组中使用,会更加节省内存。
堆排序算法
堆排序算法就是形成一个堆后,假如是大顶堆,堆顶肯定是最大的元素,那我们每次都把堆顶的最大元素拿走,然后把堆末尾的元素放到堆顶来,但是这个元素不一定是当前最大的,所以还要对这个元素在堆里进行比较,把最大的元素放到堆顶,再取出来。如此我们每次取出的都是剩余元素中最大的元素,就能得到一组从大到小有序的元素。下面我们来用大顶堆对一组数据进行堆排序计算。
数据为:[50, 10, 90, 30, 70, 40, 80, 60, 20]
算法分为两个部分
1.如何将一组无序的数据构建出一个初始的大顶堆?
2.在拿走堆顶元素之后,如何计算出新的堆顶元素?
首先我们要实现一个操作:如果一个节点的子节点比它更大,就交换位置,如果子节点还有子节点,就要继续比下去,直到末尾。这个操作我们称为:HeapOne
public void HeapOne(List<int> list, int len, int s)
{
int temp, j;
temp = list[s];//先把指定要下沉节点的值取出来
for (j = (2 * s)+1; j < len; j = (j*2)+1)
{
if (j < (len - 1) && list[j] < list[j + 1])//看看左右两个子节点谁更大,就取谁
++j;
if (temp >= list[j])//子节点比父节点小,就不管
break;
list[s] = list[j];//先把子节点的值给父节点
s = j;//继续从这个子节点往下比较下去
}
list[s] = temp;
}
实现这个操作之后,就可以开始我们的第一个部分了,形成初始大顶堆。
从最后一个非叶子节点开始,对该节点进行HeapOne,一直从下往上,直到把所有的父节点都HeapOne了一遍,一个初始的大顶堆就形成了。
public void HeapSort(List<int> list)
{
int i;
for (i = (list.Count - 1) / 2; i >= 0; i--)//第一部分,形成一个初始大顶堆
{
HeapOne(list, list.Count, i);
}
for (i = list.Count -1; i > 0; i--)//每拿走一个元素,都重新计算新堆
{
int temp = list[0];
list[0] = list[i];
list[i] = temp;
HeapOne(list, i, 0);
}
}
算法第二部分
- 我们把堆顶的元素取出,放到一个临时变量里存着。
- 然后把堆的最末尾元素取出来,放到堆顶。
- 把堆的长度-1(因为已经取出之前的堆顶元素了)
- 接着对刚刚这个从末尾放到堆顶的元素,进行HeapOne操作,让他跟子节点比较,把最大的元素交换到堆顶来,再次形成最大堆。
一直重复这个操作后,直到最后一个堆顶被取出,放到数组末尾,堆的长度也就为0了,我们的数组也就形成了一组从大到小的数列。
如此,堆排序就完成了
总结
堆排序性能比较稳定,时间复杂度包含初始堆+排序时重建堆为:O(nlogn)。
在游戏开发中也会经常使用到堆
- 比如Top K问题,从n个数据中,找出最大的前100个。
- 用堆来实现优先加载队列。
- A星寻路算法中,可以用最小堆来对寻路的开放列表维护顺序,把f值最小的放在堆顶,每次取出堆顶后,再HeapOne一次就好了。比每次都对开放列表进行排序的性能高的多。
参考
百度百科-堆排序
《大话数据结构》-程杰