排序一、快速排序

一、快排

image

快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)

算法流程:

  • 从数列中挑出一个元素,称为 “基准”(pivot);
  • 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
  • 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。

代码:

1. 递归方法

2. 非递归方法(栈)

3. 非递归方法(不用栈)【待补充】


class sortfunc():

        def partition(self,nums,left,right):
            small = left
            p = small+1
            while p<=right:
                if nums[p]<nums[left]:
                    small += 1
                    nums[small],nums[p]=nums[p],nums[small]
                p+=1
            nums[left],nums[small]=nums[small],nums[left]
            return small

        # 递归
        def quicksort1(self,nums,left,right):
            if left<right:
                s = self.partition(nums,left,right)
                self.quicksort1(nums,left,s-1)
                self.quicksort1(nums,s+1,right)
            return nums

        # 非递归+栈
        def quicksort2(self,nums):
            stack = []
            left = 0
            right = len(nums)-1
            if left<right:
                s = self.partition(nums,left,right)
                if left < s-1:
                    stack.append(left)
                    stack.append(s-1)
                if right > s+1:
                    stack.append(s+1)
                    stack.append(right)
                while stack:
                    right = stack.pop()
                    left = stack.pop()
                    s = self.partition(nums,left,right)
                    if left < s - 1:
                        stack.append(left)
                        stack.append(s - 1)
                    if right > s + 1:
                        stack.append(s + 1)
                        stack.append(right)
            return nums

4. partition函数可以用来解topk问题,前提是数据有限可以一次性存到数组nums里

topk方法:

1. 快排+截前k个

时间复杂度:O(nlogn)+O(k)=O(nlogn)。
得到的是已经排好序的前k个值

2. 小根堆【待更新】

时间复杂度O(k+(n-k)logk)=O(nlogk)

堆是一种特殊的数据结构,它的通常的表示是它的根结点的值最大或者是最小。

python中heapq的使用
堆顶(heap[0])为最小值
每个元素与堆顶比较,大于堆顶则替换堆顶,堆中始终为最大的k个数
这样最终得到的是最大的k个数,要想得到最小k个,只要把输入arr改为-arr就可以了

这里代码找的是最大的k个数,同样没有顺序:

        def topk_heap(self,nums,k):
            result = []
            for i in nums:
                if len(result)<k:
                    heapq.heappush(result,i)
                else:
                    res_min = result[0]
                    if i>res_min:
                        heapq.heapreplace(result,i)
            return result

3. 快排分治法

时间复杂度O(n)
得到的是没有排序(可能排了一部分)的数组
如果要按顺序排列的话,最后还要对这k个数排序(topk问题本身不要求排序,只要找到第k小(大)的元素)
排序后时间复杂度:O(n)+O(k*logk)

        # 求前k个小的数
        def topksmall(self,nums,k):
            if not nums:
                return []
            if k<=0:
                return []
            if k>len(nums):
                return []
            s = self.partition(nums,0,len(nums)-1)
            while not s==k-1:
                if s<k-1:
                    s = self.partition(nums,s+1,len(nums)-1)
                if s>k-1:
                    s = self.partition(nums,0,s-1)
            return sorted(nums[:k]) #这里排序了,为了后面方便使用。。。

5. leetcode里的topk问题:

  • 692、给定一个非空的整数数组,返回其中出现频率前 k 高的元素。
        def topKFrequent(self, nums, k):
            dic = {}
            for i in nums:
                if not i in dic:
                    dic[i] = 1
                else:
                    dic[i] += 1
            dic1 = list(dic.items())
            num = [x[0] for x in dic1]
            count = [x[1] for x in dic1]
            m = max(count)
            # print(num)
            # print(count)
            for j in range(len(count)):
                count[j] = m-count[j]
            # print('count=',count)
          '''注意这里要deepcopy一哈,把值复制过来,不然会改变count的值!!!'''
            count2 = copy.deepcopy(count) 
            count1 = self.topksmall(count2,k)
            # print(count)
            # count2 = copy.deepcopy(count1)
            s = []
            for l in count1:
                tmp = count.index(l)
                s.append(num[tmp])
                count[tmp]=-1
            return s

P.S. 实际问题

实际上,具体采用哪种方法,要根据实际场景决定
分治法时间复杂度低,空间复杂度高
最小堆方法时间复杂度高,空间复杂度低

(1)足够大内存——分治法

(2)多核——多线程处理,划分数据后再归并

(3)单核+受限内存——划分数据后依次处理

*自己写给自己看的博客
*文章内容不保证正确
*部分内容来源于网络,侵删
今天也是元气满满的一天哦~~
冲鸭~~QWQ

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343