五分钟玩转面试考点-数据结构-最大堆与最小堆(TOP N问题)

引子:五分钟玩转面试考点-数据结构系列,不会像那种严肃、古板的教科书般的博客文章,而是将晦涩难懂的概念和知识点尽可能幽默的细说出来,或结合生活场景,或从零开始分析。带给大家一个严肃而不失风趣的数据结构。

咳咳:俗话说:脱离业务的技术,就是耍流氓。那么我就要提出这篇文章的灵魂一问了,请听题:

1. 1千万整数找出重复次数最多的100个整数。
2. 如何找出每日访问网站最高的10个IP。
3. 有一个1GB大小的文件,里面的每一行是一个词,词的大小不超过16个字节,内存限制大小是1MB。返回频数最高的100个词。

这个时候,感觉就是M个数中选择N个数 ,就是TOP N问题呀,是不是脑海中不由自主的蹦出了排序算法啦~
哈哈,咱就按照这个思路走。然后,表面不慌,假装思索中ing,其实内心再想:排序算法是啥呀?

这里简单提下:

冒泡排序,核心思想:相邻比较。每次将最大的浮出水面。

快速排序,核心思想:分治法+挖坑填数。每次选择一基数,排序完成左边比基数小,右边比基数大。一直切分(分治),直至选出无序的最大的N个整数。

堆排序(出场自带猪脚光环~),可以创建一个N大小的最小堆。然后balabala。

这时候你可能要打断一下了:啥?最小堆?我这是要选出最大的N个元素呀?有木有搞错?emmm等等,啥叫堆???啥叫最小堆???为什么不选最大堆呢???

请听我戏说一下:

基础概念:

堆:分为最大堆最小堆,其实就是完全二叉树最大堆要求父节点的元素都大于等于子节点最小堆要求父节点元素小于等于子节点。

下面图解下如何生成大根堆:

我就拿(内心PS:读书人的事情,怎么能说偷呢?)一下图吧,放在这里这里让大家容易理解~~
给定一个列表array=[16,7,3,20,17,8],对其进行堆排序。
首先根据该数组元素构建一个完全二叉树,得到

原始的数据堆

然后需要构造初始堆,则从最后一个非叶节点开始调整,调整过程如下:

第一步:找到最后一个组(非叶节点),左节点8 pk 擂主3,左孩子8胜利!然后3和8互相调换位置。败者3没有子节点,结束比赛。

小组赛第一场.png

从右到左。组内pk,左子树20 pk 右子树17 左子树20胜利,获得挑战擂主7的机会。左子树20 pk 擂主7 左子树20胜利,20和7交换位置。败者7没有子节点,结束比赛。

小组赛第二场

从下到上,左子树20 PK 右子树8,左子树20胜利。获得挑战擂主16的机会。左子树20 pk 擂主16 左子树胜利,交换位置。
此时败者16含有孩子节点,将被挑战。

小组赛第三场!冠军战!

组内挑战开始:左子树7右子树17组内pk,右子树17胜利。获取挑战擂主16的机会。右子树17擂主16pk,右子树17胜利,交换位置。败者16无孩子节点,结束比赛。

败者挑战赛

这样就得到了初始堆

哈哈,相信到这里,基本懂得同学还是懂,不懂得还是一脸XX。这是哪?我在干什么?你是谁?

咱们慢慢分析:

无序数组转化为大根堆步骤:

1.找到最后一个非叶节点,从右到左,从下到上,遍历所有非叶节点

2.若是父节点小于最大的子节点,那么交换父子节点的位置,但是要注意,交换之后对其他节点的影响。

我们的目标是:
(没有蛀牙....)根节点一定是树中最大的值。同时,父节点大于子节点

切回到我们的问题。此时,你应该基本知道了堆的概念,为什么不选最大堆呢?因为咱们选最小堆就是采用末位淘汰制。将堆中最小元素剔除。
每次最小堆调整后,总会将整个堆中最小的元素放在根节点上,然后我们分别取出[N-1,M]中的元素,若大于堆顶,则替换。然后(随着堆的蠕动,你可以动态想想这个画面~~再次将最小元素选出放于堆顶。直至堆里保存的都是最大的元素。

此时,你会想怎么细节怎么实现的:如何确定最后一个非叶节点呢?如何精确找到每一个孩子节点呢?

嘿嘿,我可真是一个小机灵鬼...,放心,全都给你整的明明白白的~

如何确定父节点和子节点的下标位置呢?

(1) 它的左孩子结点是:R[2i+1];
(2) 它的右孩子结点是:R[2
i+2];
(3) 它的父结点是:R[(i-1)/2];

骗谁呢?具体解释下,不要粘贴公式糊弄你的小可爱们!哼~

那好,咱们从零分析一下:

还是上面的数组,证据在上面,咱们就开始分析啦:

array=[16,7,3,20,17,8] 一个长度为6的数组。

咱们从i=5,最后一个元素array[5]开始说起:
父节点:(i-1)/2=2,他的父节点就是i=2,array[2]也就是3。
子节点2i+1=11,等等兄得,你越界了...你根本没有孩子节点...(名侦探小胖)
于是我就大胆推测一下,最后一个非子节点就是array[2]。

反向推理一下:i=2时,左孩子:2i+1=5,右孩子:2i+2=6,但是最大下标是5,那么只有一个孩子节点array[5]也就是8。

那倒数第二个下标非叶节点的下标是啥?
博主内心独白:emmm我也不知道....继续套公式,看看有啥规律不。

数组倒数第二个下标数是i=4,(i-1)/2=1,那么下标array[1]就是第2个父节点。
数组倒数第三个下标数是i=3,(i-1)/2=1,也是下标array[1]。

那倒数第一个下标非叶节点的下标是啥?
数组倒数第四个下标数是i=2,(i-1)/2=1,那么下标array[0]就是第3个父节点。
数组倒数第三个下标数是i=1,(i-1)/2=1,也是下标array[0]。

此时还有吗?
数组倒数第五个下标数是i=0,(i-1)/2=-1,也是下标array[-1]。

也就是根节点没有父节点了....

等等,我好像发现啥规律了...
父节点是array[2]=3 array[1]=7 array[0]=16。
array=[16,7,3,20,17,8]


image

在我找到最后一个非叶节点 i 之后,通过i-1找到其他非叶节点,直到根节点的下标是0。

可是,概念太多,记不住呀。没事,安排好了,结合一个生活场景,真正做到熟记于心~

结合生活场景解释一下:

现在要开始 XX联盟S17 的比赛,比赛组根据玩家投票新采用了一种新的比赛规则,规则如下:

横向:每个新晋擂主可以参与更高一级的比赛,直至选出冠军。登顶大根堆顶峰;

纵向:每个下台擂主要被更低一级的选手挑战,需要证明自己实力,也可能被一撸到底;

简言之:能者上,弱者下
每一小组选出最强者,参与擂主pk,胜利者获取下一次挑战机会;失败者要被挑战,直至完成一场胜利,或者排名倒数

   //比赛开始-请各小组按顺序进行比赛(从排名最后一个小组开始)
public static int[] createMaxHeap(int[] arr) {
   int length = arr.length;
    //冠军下标是0
    for (int i = (length - 1-1) / 2; i >= 0; i--) {
        //开启小组擂台赛
        doJustHeapMove(arr, i, length);
    }
    return arr;
}

而后,开始了激烈的小组比赛,擂主先把收拾自己的东西,因为他也不知道自己是一败涂地还是保持原位!心里有些忐忑~

//小组擂台开始
private static void doJustHeapMove(int[] arr, int root, int length) {
    int temp = arr[root];  //擂主将自己的东西保存好

    //确定小组成员,确保每一个人都有机会挑战(最后元素:length-1)
    //若发起挑战,擂主失败,那么就会子节点挑战
    //每次开始,均获取到小组成员编号(而开始的root若是挑战失败,便成为了lChild)
    for (int lChild = 2 * root + 1; lChild < length; lChild = 2 * lChild + 1) {
        //判断左节点是否是length-2,即不是最后一个元素!
        //若是最后一个元素,小组只有自己,直接参与擂台赛
        //选出小组最强者,准备参与擂主pk,
        if (lChild < length - 1 && arr[lChild + 1] > arr[lChild]) {
            lChild++;
        }
        //擂台赛开始
        if (temp >= arr[lChild]) {
            break;  //小组擂台赛结束,开始下一小组的比赛
        } else {
            arr[root] = arr[lChild];  //成员升级(擂主)
            root = lChild;   //擂主降级(获取到降级的编号)
        }
    }
    //擂主降级赛结束,灰溜溜的走了~
    arr[root] = temp;
}

我还会回来的(擂主内心独白)~~

力扣解法

215. 数组中的第K个最大元素

兜兜转转,从第一篇博客到2021.08.22已经过去了2年半多了。今天又回到这个题目。带来一种最小堆更加简洁的实现。即依赖JDK API来实现最小堆,只需要使得最小堆维护top n个元素即可。

class Solution {
    /**
     * 最小堆实现TOP N
     */
    public int findKthLargest(int[] nums, int k) {
        //定义的最小堆
        PriorityQueue<Integer> queue = new PriorityQueue<>(k, (a, b) -> a - b);

        //最小堆,先入k个元素
        for (int i = 0; i < k; i++) {
            queue.add(nums[i]);
        }
        for (int i = k; i < nums.length; i++) {
            //取出堆顶元素,但不移除
            int min = queue.peek();
            //若num[i]大于堆中最小元素,即堆中最小元素不是Top N
            if (nums[i] > min) {
                //移除堆顶元素
                queue.poll();
                //将元素放入堆中
                queue.offer(nums[i]);
            }
        }
        return queue.peek();
    }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容