1、排序算法概述
所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序算法,就是如何使得记录按照要求排列的方法。排序算法在很多领域得到相当地重视,尤其是在大量数据的处理方面。
一个排序算法是稳定的,就是当有两个相等记录的关键字R和S,且在原本的列表中R出现在S之前,在排序过的列表中R也将会是在S之前。
如果算法是稳定的有什么好处呢?排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。基数排序就是这样,先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。
排序算法根据是否需要访问外存分为内部排序和外部排序。
内部排序是指待排序列完全存放在内存中所进行的排序过程,适合不太大的元素序列。
外部排序指的是大文件的排序,即待排序的记录存储在外存储器上,待排序的文件无法一次装入内存,需要在内存和外部存储器之间进行多次数据交换,以达到排序整个文件的目的。
我们现在要讨论的排序都是内部排序。
2、冒泡排序
冒泡排序的效率很低,但是算法实现起来很简单,因此很适合作为研究排序的入门算法。
2.1 基本思想
对当前还未排好序的范围内的全部数,自上而下对相邻的俩个数依次进行比较和调整,让较大的数下沉,较小的数往上冒。即:每当俩相邻的数比较后发现他们的排序与排序的要求相反时,就将他们交换。每次遍历都可确定一个最大值放到待排数组的末尾,下次遍历,对该最大值以及它之后的元素不再排序(已经排好)。
2.2 实例
public class Sort {
private int[] array;
public Sort(int[] array) {
this.array = array;
}
// 按顺序打印数组中的元素
public void display() {
for (int i = 0; i < array.length; i++) {
System.out.print(array[i] + "\t");
}
System.out.println();
}
// 冒泡排序
public void bubbleSort() {
int temp;
int len = array.length;
for (int i = 0; i < len - 1; i++) { // 外层循环:每循环一次就确定了一个相对最大元素
for (int j = 1; j < len - i; j++) { // 内层循环:有i个元素已经排好,根据i确定本次的比较次数
if (array[j - 1] > array[j]) { // 如果前一位大于后一位,交换位置
temp = array[j - 1];
array[j - 1] = array[j];
array[j] = temp;
}
}
System.out.print("第" + (i + 1) + "轮排序结果:");
display();
}
}
}
测试代码:
public static void main(String[] args) {
int [] a = {1,5,4,11,2,20,18};
Sort sort = new Sort(a);
System.out.print("未排序时的结果:");
sort.display();
sort.bubbleSort();
}
打印结果:
2.3 算法分析
上面的例子中,待排数组中一共有7个数,第一轮排序时进行了6次比较,第二轮排序时进行了5比较,依次类推,最后一轮进行了一次比较。
加入元素总数为N,则一共需要的比较次数为:
(N-1)+ (N-2)+ (N-3)+ ...1=N*(N-1)/2
这样,算法约做了N^2/2
次比较。因为只有在前面的元素比后面的元素大时才交换数据,所以交换的次数少于比较的次数。如果数据是随机的,大概有一半数据需要交换,则交换的次数为N2/4(不过在最坏情况下,即初始数据逆序时,每次比较都需要交换)。
交换和比较的操作次数都与N2成正比,由于在大O表示法中,常数忽略不计,冒泡排序的时间复杂度为O(N2)
。
O(N2)的时间复杂度是一个比较糟糕的结果,尤其在数据量很大的情况下。所以冒泡排序通常不会用于实际应用。
3、冒泡排序的改进
上面已经分析过,冒泡排序的效率比较低,所以我们要通过各种方法改进。
最简单的改进方法是加入一标志性变量exchange,用于标志某一趟排序过程中是否有数据交换,如果进行某一趟排序时并没有进行数据交换,则说明数据已经按要求排列好,可立即结束排序,避免不必要的比较过程。
在上例中,第四轮排序之后实际上整个数组已经是有序的了,最后两轮的比较没必要进行。
改进后的代码如下:
public void bubbleSort_improvement_1() {
int temp;
int len = array.length;
for (int i = 0; i < len - 1; i++) {
boolean exchange = false; // 设置交换变量
for (int j = 1; j < len - i; j++) {
if (array[j - 1] > array[j]) { // 如果前一位大于后一位,交换位置
temp = array[j - 1];
array[j - 1] = array[j];
array[j] = temp;
if (!exchange)
exchange = true; // 发生了交换操作
}
}
System.out.print("第" + (i + 1) + "轮排序结果:");
display();
if (!exchange)
break; // 如果上一轮没有发生交换数据,证明已经是有序的了,结束排序
}
}
用同样的初始数组测试,打印结果如下:
上面的改进方法,是根据上一轮排序有没有发生数据交换作为标识,进一步思考,如果上一轮排序中,只有后一段的几个元素没有发生数据交换,是不是可以判定这一段不用在进行比较了呢?答案是肯定的。
例如上面的例子中,前四轮的排序结果为:
- 未排序时的结果:1 5 4 11 2 20 18
- 第1轮排序结果:1 4 5 2 11 18 20
- 第2轮排序结果:1 4 2 5 11 18 20
- 第3轮排序结果:1 2 4 5 11 18 20
- 第4轮排序结果:1 2 4 5 11 18 20
第1轮排序之后,11、18、20已经是有序的了,后面的几次排序后它们的位置都没有变化,但是根据冒泡算法,18依然会在第2轮参与比较,11依然会在第2轮、第3轮参与比较,其实都是无用功。
我们可以对算法进一步改进:设置一个pos指针,pos后面的数据在上一轮排序中没有发生交换,下一轮排序时,就对pos之后的数据不再比较。
代码改动如下:
public void bubbleSort_improvement_2() {
int temp;
int counter = 1;
int endPoint = array.length - 1; // endPoint代表最后一个需要比较的元素下标
while (endPoint > 0) {
int pos = 1;
for (int j = 1; j <= endPoint; j++) {
if (array[j - 1] > array[j]) { // 如果前一位大于后一位,交换位置
temp = array[j - 1];
array[j - 1] = array[j];
array[j] = temp;
pos = j; // 下标为j的元素与下标为j-1的元素发生了数据交换
}
}
endPoint = pos - 1; // 下一轮排序时只对下标小于pos的元素排序,下标大于等于pos的元素已经排好
System.out.print("第" + counter + "轮排序结果:");
display();
}
}
对的算法来说,没有最好,只有更好。上面的两种改进方法其实治标不治本,是一种“扬汤止沸”的改进,下面我们来一次“釜底抽薪”的改进。
传统的冒泡算法每次排序只确定了最大值,我们可以在每次循环之中进行正反两次冒泡,分别找到最大值和最小值,如此可使排序的轮数减少一半。
改进代码如下:
public void bubbleSort_improvement_3() {
int temp;
int low = 0;
int high = array.length - 1;
int counter = 1;
while (low < high) {
for (int i = low; i < high; ++i) { // 正向冒泡,确定最大值
if (array[i] > array[i + 1]) { // 如果前一位大于后一位,交换位置
temp = array[i];
array[i] = array[i + 1];
array[i + 1] = temp;
}
}
--high;
for (int j = high; j > low; --j) { // 反向冒泡,确定最小值
if (array[j] < array[j - 1]) { // 如果前一位大于后一位,交换位置
temp = array[j];
array[j] = array[j - 1];
array[j - 1] = temp;
}
}
++low;
System.out.print("第" + counter + "轮排序结果:");
display();
counter++;
}
}