本文将介绍排序算法中的归并排序,学习归并排序需要很好地理解计算机中的分治思想和递归思想。
1 分治思想
归并排序,利用分而治之的思想,将大的问题,转换成简单的,小的问题来解决。分治,字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。在计算机科学中,分治法就是运用分治思想的一种很重要的算法。它的核心思想可以用一句话来概括:大事化小,小事化了。
使用分治法解决问题,需要有两部分内容,一部分是分解,将问题不停分解成更小的子问题,当问题小到一定规模时,可以比较容易地解决。一部分是合并,当子问题被解决时,要通过一定的方法,合并出原问题的解。
2 归并排序
归并排序是怎么分的呢?我们要对n个数排序,直接排太麻烦,拆成对两部分,对n/2个数排序,把它们合并成一个有序数组,就是答案。对n/2个数排序还是太复杂,继续二分下去,n/4,n/8,n/16……直到分到最小,也就是长度为1为止。这个时候就不用分了。因为长度为1本身已经有序了。
如图是归并排序的一个例子,前四行是对问题进行分解,后四行是对子问题进行合并,最终得到原始问题的解。
使用分治的思想解决计算机的问题,分解的部分是比较简单的,合并的部分是比较难的,并且这部分的效率也影响到了算法的整体效率。
对于归并排序来说,合并部分的任务是,把有序序列合并成一个完整的有序序列。怎么合并呢?
我们把有序序列1和2进行合并,需要另外一片新的空间,用来存放合并后的数组。我们首先比较序列1和2的开头,由于是有序序列,开头就是最小的元素。比较两个元素看谁更小,把最小的那个元素添加到合并序列中。添加完之后,把该元素从序列里移除(实际代码中并不会移除,而是指针直接指向下一个位置)。以上面图①为例,2和3比较,2比较小,填入到合并序列中。然后把2去掉。变成②中的情况。再把3和5比较,3比较小,加入到合并序列中,把3从原始序列中去掉。如此反复,直到序列1和2都合并完毕。
如果出现一个序列已经空了,另一个序列还有多个元素,直接把这些元素添加到合并序列最后面即可。
3 代码解析
merge_sort函数定义了长度为n的辅助数组,用于归并排序中合并的过程。
sort函数,对数组进行分割,将问题划分为左半部分和右半部分两个子问题,之后将两个子问题进行合并。注意到这里使用了递归,使得问题不断分解,直到left>=right,此时子问题的数组长度为1。
对递归不了解的可以查看
要理解递归,你先要理解递归mp.weixin.qq.commerge函数是归并排序中合并的部分。它对两个有序序列进行合并,合并成大的有序序列。这部分看代码不难理解。
4 效率分析
归并排序的时间复杂度T(n),每次可以分解出相同规模的子问题,并且这两个子问题合并的复杂度为O(n),则T(n)=2T(n/2)+O(n),根据主定理可以得到T(n)=O(nlogn)。需要注意的是,合并部分的时间复杂度如果过高,比如为O(n^2),会导致整体时间复杂度变大。