二叉堆

1. 思考

Top k 问题：从海量数据中获取前k个 最大值 或 最小值；
比如从 一百万 个整数中，获取最大的1000个整数；
设计一种数据结构，用来存放整数元素，包括的操作是 获取最大值，添加元素，删除最大值：

各数据结构的时间复杂度对比
为了能达到最优，使用堆：
堆：获取最大值时间复杂度O(1)，添加元素时间复杂度O(log n)，删除最大值时间复杂度O(log n)；

2. 堆 (Heap)

这里的堆是一种数据结构，不是指内存中堆，堆一般分为：

二叉堆（Binary Heap，完全二叉堆）；
多叉堆（D-heap、D-ary Heap）;
索引堆（Index Heap）;
二项堆（Binomial Heap）；
斐波那契堆（Fibonacci Heap）；
左倾堆（Leftist Heap）；
斜堆（Skew Heap）；

堆的最重要性质：任意节点的值总是 $\geq$ 或者 $\leq$ 子节点的值：

如果任意节点的值 $\geq$ 子节点的值，称为最大堆、大根堆、大顶堆；
如果任意节点的值 $\leq$ 子节点的值，称为最小堆、小根堆、小顶堆；

3. 二叉堆 (Binary Heap)

二叉堆的数据结构是一棵完全二叉树，因此也被称为完全二叉堆;
鉴于二叉堆的结构，底层可以用数组实现；

最大二叉堆数据结构

二叉堆的索引规律（从0开始，与数组对应）

i = 0 , 表示根节点；
i > 0 ，则父节点索引为floor( (i-1) / 2)；
如果 2i + 1 <= n - 1，它的左子树索引为 2i + 1 ；
如果 2*i + 1 > n - 1 ，该节点无左子树；
如果 2i + 2 <= n -1 ,该节点的右子节点索引为 2i + 2;
如果 2*i + 2 > n - 1，该节点无右子节点；

二叉堆的接口设计

int size(); $\qquad$ //返回二叉堆元素个数；
boolean isEmpty(); $\qquad$ //判断是否为空；
void clear(); $\qquad$ //清空二叉堆；
void add(E element); $\qquad$ //添加元素；
E get(); $\qquad$ //获取堆顶元素；
E remove(); $\qquad$ //删除堆顶元素；
E replace(E element); $\qquad$ //替换堆顶元素

4. 二叉堆获取最大值

获取堆顶，就能获取最大值

public E get() {
        emptyCheck();
        return elements[0];
    }

5. 二叉堆添加元素

二叉堆添加元素（添加85）

如果node的值 > 父节点的值；

与父节点交互位置

如果node的值 <= 父节点的值，或者node没有父节点；

退出循环

这个过程叫做上滤(Sift Up)；

时间复杂度为 O( log n)

// 添加元素
public void add(E element) {
        elementNotNullCheck(element);
        ensureCapacity(size + 1);
        elements[size++] = element;
        siftUp(size - 1);
    }
// 上滤
private void siftUp(int index) {
        E e = elements[index];
        while (index > 0) {
            int pindex = (index - 1) >> 1;
            E p = elements[pindex];
            if (compare(e, p) <= 0) return;
            
            // 交换index、pindex位置的内容
            E tmp = elements[index];
            elements[index] = elements[pindex];
            elements[pindex] = tmp;
            
            // 重新赋值index
            index = pindex;
        }
        
    }

6. 二叉堆删除最大值

二叉堆删除元素（删除85）

堆是一种数据结构，只能删除堆顶元素，所以删除 最大值，不能删除其他位置的，参考栈结构。删除的操作如下：

将存放堆的数组最后一个元素，覆盖堆顶（node），然后将数组最后一个元素删除；
如果该节点（node）的值 < 最大子节点的值；

将node与子节点交互位置；

如果该节点（node）的值 >= 最大子节点的值，或者已经没有子节点了；

退出循环；

该过程称为下滤（Shit Down）;

时间复杂度为 O( log n)

// 删除堆顶
public E remove() {
        emptyCheck();
        
        int lastIndex = --size;
        E root = elements[0];
        elements[0] = elements[lastIndex];
        elements[lastIndex] = null;
        
        siftDown(0);
        return root;
    }

     // 下滤
    private void siftDown(int index) {
        E element = elements[index];
        int half = size >> 1;
        // half 为第一个叶子节点索引
        while (index < half) { 
            // index的节点有2种情况
            // 1.只有左子节点
            // 2.同时有左右子节点
            
            // 获取左子节点
            int childIndex = (index << 1) + 1;
            E child = elements[childIndex];
            
            // 获取右子节点
            int rightIndex = childIndex + 1;
            
            // 选出最大的子节点
            if (rightIndex < size && compare(elements[rightIndex], child) > 0) {
                child = elements[childIndex = rightIndex];
            }
            
            if (compare(element, child) >= 0) break;

            // 将子节点存放到index位置
            elements[index] = child;
            // 重新设置index
            index = childIndex;
        }
        elements[index] = element;
    }

6. 二叉堆替换堆顶元素

替换（replace）和删除最大值一样，都是替换堆顶元素，然后判断是否大于 最大子节点，如果大于，那么进行下滤，直到小于或者是叶子节点才退出循环；

public E replace(E element) {
        elementNotNullCheck(element);
        
        E root = null;
        if (size == 0) {
            elements[0] = element;
            size++;
        } else {
            root = elements[0];
            elements[0] = element; // 替换堆顶
            siftDown(0); //下滤
        }
        return root;
    }

7. 小顶堆的创建

以上所讲的都是大顶堆，小顶堆的创建非常简单，只要修改compare的函数就可以。

小顶堆

// 大顶堆的compare
public int compare(Integer o1, Integer o2) {
                return o1 - o2;
            }

// 小顶堆的compare
public int compare(Integer o1, Integer o2) {
                return o2 - o1;
            }

8. 应用

1. Top k 问题

从n个整数/浮点数中，取出k个最大值，其中 k 远远小于 n；
可以使用全排序进行来得出最大的k个值，但是时间复杂度为O( n log n);
使用二叉堆，时间复杂度为 O( n log k);

步骤如下：

创建一个小顶堆；
遍历这n个值；

先将 k 个值，添加到小顶堆中；
从第k+1个值开始，先获取堆顶元素（ heap.get() ），比较；
如果大于堆顶元素，替换堆顶，进行下滤操作；
如果小于等于堆顶元素，循环下一个元素；

遍历结束后，存放k个值的小顶堆，就是存放最大的k个值；

for (int i = 0; i < data.length; i++) {
            if (heap.size() < k) { // 前k个数添加到小顶堆
                heap.add(data[i]); 
            } else if (data[i] > heap.get()) { // 如果是第k + 1个数，并且大于堆顶元素
                heap.replace(data[i]); 
            }
        }

2. 优先级队列

创建一个大顶推；
设置队列节点的优先级权重；
以权重来实现作为compare的判断条件；
这样权重最大的节点，被放在堆顶，权重越小的就放在后面的节点；
在执行队列时，会调用remove()，获取堆顶的节点，执行操作；

最后编辑于：2019.06.17 13:44:34

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,033评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,725评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,473评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,846评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,848评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,691评论 1赞 282
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,053评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,700评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,856评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,676评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,787评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,430评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,034评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,990评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,218评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,174评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,526评论 2赞 343

二叉堆

1. 思考

2. 堆 (Heap)

3. 二叉堆 (Binary Heap)

4. 二叉堆 获取最大值

5. 二叉堆 添加元素

6. 二叉堆 删除最大值

6. 二叉堆 替换堆顶元素