其实写排序算法的博客已经有很多了,其中不乏某些细心的博主去仔细讲解各种排序的过程,甚至有使用gif图来表现排序过程的博客,还有对已有排序算法进行改进的,我表示很佩服这些博主,谢谢你们。
这里附上一些我参考过的博客:
7种排序算法(系列博客) - 静默虚空
常用排序算法总结(一) - SteveWang
[直观学习排序算法] 视觉直观感受若干常用排序算法 - todayx
白话经典算法系列 - MoreWindows
常用排序算法稳定性、时间复杂度分析 - jiuyueguang
八大排序算法
然后附上我重新写的排序算法
这里的排序算法示例都用函数模板来写
- 简单排序算法:
- 选择排序
- 冒泡排序
- 插入排序
- 复杂排序算法:
- 快速排序
- 归并排序
- 堆排序
- shell排序
选择排序
- 原理:遍历元素集合,每次遍历找到剩下的集合中最大\最小的元素放入已排序集合中,直到找完为止。
- 时间复杂度:O(n^2)
- 空间复杂度:O(1)
- 算法稳定性:不稳定排序。使用序列6 9 6 3 2来举例,第一个6与3交换,导致第一个6排到了第二个6后面,所以选择排序是不稳定的排序算法。
- 算法示例:
template <class T>
void sort_array_select(T* dataArray, int dataSize)
{
//遍历数据集合
for (int i = 0; i < dataSize; i++)
{
//记录最小索引
int minIndex = i;
//遍历剩余数据集合
for (int j = i; j < dataSize; j++)
{
//查找更小的值
if (dataArray[minIndex] > dataArray[j])
{
//保存更小值的索引
minIndex = j;
}
}
//判断当前索引处是否是最小值
if (minIndex != i)
{
//将找到的最小值与当前索引处的值交换
T temp = dataArray[i];
dataArray[i] = dataArray[minIndex];
dataArray[minIndex] = temp;
}
}
}
冒泡排序
- 原理:遍历元素集合,依次比较相邻元素,将相邻元素中较大\较小者移向一端,每次遍历找到剩余数据集合中较大\较小者,直到全部排序完成。
-
时间复杂度:
- 最佳(已经顺序排好的集合):O(n)
- 最差(已经逆序拍好的集合):O(n^2)
- 空间复杂度:O(1)
- 算法稳定性:稳定的排序。因为比较与交换均发生在相邻的元素之间,对于两个相等的元素不会进行交换,所以是稳定的排序。
- 算法示例:
template <class T>
void sort_array_bubble(T* dataArray, int dataSize)
{
//遍历集合
for (int i = 0; i < dataSize; i++)
{
//遍历剩余元素集合
for (int j = 0; j < dataSize - i - 1; j++)
{
//比较相邻元素大小
if(dataArray[j] > dataArray[j + 1])
{
//将较大元素后移
T temp = dataArray[j];
dataArray[j] = dataArray[j + 1];
dataArray[j + 1] = temp;
}
}
}
}
插入排序
- 原理:将数据集合中第一个数据视为已排序集合,依次获取未排序集合中的元素,将获取到的元素插入到已排序集合中的正确位置,直到全部排序完成。
-
时间复杂度:
- 最佳(已排序集合):O(n)
- 最差(逆序已排序集合):O(n^2)
- 空间复杂度:O(1)
- 算法稳定性:稳定的排序算法。因为比较的过程发生在相邻元素之间,对于相等的元素,算法中不会改变他们的相对位置,所以是稳定的排序算法。
- 算法示例:
template <class T>
void sort_array_insert(T* dataArray, int dataSize)
{
//遍历数据集合(从1开始,0号元素已排序)
for (int i = 1; i < dataSize; i++)
{
//获取未排序集合中第一个元素
T temp = dataArray[i];
int j = i;
//依次与已排序集合中元素比较,找到正确位置
while(j > 0 && temp < dataArray[j - 1])
{
dataArray[j] = dataArray[j - 1];
j--;
}
//取到的元素放入已排序列表中正确位置
dataArray[j] = temp;
}
}
快速排序
- 原理:应用了分治的思想和以递归取代循环的思想。取一个元素作为flag,并将数据集合分为大于(等于)flag和小于(等于)flag两个子集,然后对子集进行同样的操作,直到子集元素个数为1或0,则所有元素完成排序。
-
时间复杂度:
- 最差(每次取到的flag都在边界):O(n^2)
- 最佳(每次取到的flag都在中间):O(nlog2n)
- 空间复杂度:O(1)
- 算法稳定性:不稳定的排序。因为比较和替换不是发生在相邻元素之间,而是从某个方向开始找到满足条件的值,然后进行替换,这样可能导致两个相同元素的相对位置变化,所以是不稳定的排序方式。
- 算法示例:
template <class T>
void sort_array_quick(T* dataArray, int left, int right)
{
//递归退出条件
if (left >= right)
{
return;
}
//取flag,并控制左右范围
T flag = dataArray[left];
int sub_left = left;
int sub_right = right;
//根据flag来整理数据集合
while(sub_left < sub_right)
{
//在右侧找小的值换到左侧
//此时dataArray[sub_left]中的值是冗余的
while (sub_left < sub_right && dataArray[sub_right] >= flag)
{
sub_right--;
}
if (sub_left < sub_right)
{
dataArray[sub_left] = dataArray[sub_right];
}
//在左侧找大的值换到右侧
//此时dataArray[sub_right]中的值是冗余的
while (sub_left < sub_right && dataArray[sub_left] <= flag)
{
sub_left++;
}
if (sub_left < sub_right)
{
dataArray[sub_right] = dataArray[sub_left];
}
}
//上面的步骤进行完成后,dataArray[sub_left]中的值是冗余的,这里将flag放回
dataArray[sub_left] = flag;
//以flag为中心,左侧的值小于等于flag,右侧的值大于等于flag
//分别对左侧的值的集合和右侧的值的集合进行递归再次排序划分
sort_array_quick(dataArray, left, sub_left - 1);
sort_array_quick(dataArray, sub_left + 1, right);
}
归并排序
- 原理:应用了分治的思想和以递归取代循环的思想。将待排序数据集合划分为两个子集,对子集分别进行排序,排序完成后将两个有序子集中的元素。
- 时间复杂度:O(nlog2n)
- 空间复杂度:O(n)
- 算法稳定性:稳定的排序算法。在元素集合被拆分为n个子集合之后,合并集合时,是通过对已排序集合中值最相近的两个元素进行比较并存储的,所以不会造成值相同的元素相对位置变化。
- 算法示例:
//按顺序合并集合
template <class T>
void array_merge(T* dataArray, int left, int mid, int right, T* sortedArray)
{
int i = left;
int j = mid + 1;
int count = 0;
//将dataArray中left->mid和mid+1->right部分的元素按顺序放入sortedArray中
while (i <= mid && j <= right)
{
if (dataArray[i] < dataArray[j])
{
sortedArray[count++] = dataArray[i++];
}
else
{
sortedArray[count++] = dataArray[j++];
}
}
//剩余元素直接放入sortedArray
while (i <= mid)
{
sortedArray[count++] = dataArray[i++];
}
while (j <= right)
{
sortedArray[count++] = dataArray[j++];
}
//排序好的元素放回dataArray
for (int i = 0; i < count; i++)
{
dataArray[left + i] = sortedArray[i];
}
}
//拆分集合
template <class T>
void sort_array_merge(T* dataArray, int left, int right, T* sortedArray)
{
//递归停止条件
if (left >= right)
{
return;
}
//集合分为两个子集
int mid = (left + right) / 2;
//继续拆分
sort_array_merge(dataArray, left, mid, sortedArray);
sort_array_merge(dataArray, mid + 1, right, sortedArray);
//按顺序合并集合
array_merge(dataArray, left, mid, right, sortedArray);
}
堆排序
- 原理:应用了二叉堆的特点,即父节点的值总是大于(小于)子节点的值。这样每一次将待排序集合调整为堆时,便能得到待排序集合中的一个最值。堆排序分为两步:第一步是建立堆,将无序的集合调整为满足堆的条件的集合;第二步是依次取得最值,此时只破坏了堆顶,以堆顶为根进行一次调整,形成一个新的堆,然后循环第二步。
- 时间复杂度:O(nlog2n)
- 空间复杂度:O(1)
- 算法稳定性:不稳定的排序算法。因为比较与交换不是发生在相邻元素之间,两个相同的元素相邻时会被分配到不同的子树中,在调整子树时可能导致值相同的元素的相对位置发生变化。
- 算法示例:
//调整为最大堆,保证父节点值大于子节点
template <class T>
void heap_update(T* dataArray, int rootIndex, int arraySize)
{
//递归终止条件,rootIndex处应为非叶子节点
if (rootIndex >= arraySize / 2)
{
return;
}
//计算左右子节点的index
int left_child = rootIndex * 2 + 1;
int right_child = rootIndex * 2 + 2;
//查找父、左子、右子节点中最大值
int largest = rootIndex;
if (left_child < arraySize && dataArray[left_child] > dataArray[largest])
{
largest = left_child;
}
if (right_child < arraySize && dataArray[right_child] > dataArray[largest])
{
largest = right_child;
}
//将最大值替换到父节点位置
if (largest != rootIndex)
{
T temp = dataArray[rootIndex];
dataArray[rootIndex] = dataArray[largest];
dataArray[largest] = temp;
//largest所处位置元素相对其子节点来说,又是一个被破坏的堆顶,所以继续调整
heap_update(dataArray, largest, arraySize);
}
//对左右子节点分别进行调整
//heap_update(dataArray, left_child, arraySize);
//heap_update(dataArray, right_child, arraySize);
}
//建立堆。即逆序对所有非叶子节点进行一次堆调整。
template <class T>
void heap_build(T* dataArray, int arraySize)
{
for (int i = arraySize / 2 - 1; i >= 0; i--)
{
heap_update(dataArray, i, arraySize);
}
}
//堆排序
template <class T>
void sort_array_heap(T* dataArray, int arraySize)
{
//建立堆
heap_build(dataArray, arraySize);
//循环获得堆顶元素并调整堆
int count = arraySize;
while (count > 1)
{
//将堆顶元素与待排序数组末尾元素交换
T temp = dataArray[0];
dataArray[0] = dataArray[count - 1];
dataArray[count - 1] = temp;
//调整堆,只破坏了堆顶,这里以堆顶为root,对待排序的部分进行堆调整
count--;
heap_update(dataArray, 0, count);
}
}
shell排序
- 原理:对直接插入法排序的改良。因为直接插入法排序在元素基本有序的情况下效率最高,所以将待排序元素依次划分为n组(n为size/2,size/4,... 首先保持元素数量最少,组内排序完成后再重新划分为元素更多的组,保持直接插入法的高效),然后对组内进行直接插入法排序。
-
时间复杂度:
- 最差:O(n^2)
- 最佳(有序排列的集合):O(nlog2n)
- 空间复杂度:O(1)
- 算法示例:
template <class T>
void sort_array_shell(T* dataArray, int arraySize)
{
//使用step划分组
for (int step = arraySize / 2; step > 0; step /= 2)
{
//逐个元素进行组内插入排序
for (int i = step; i < arraySize; i++)
{
//组内直接插入排序
T temp = dataArray[i];
int k = i - step;
//在组内依次向前查找正确位置
while (k >= 0 && dataArray[k] > temp)
{
dataArray[k + step] = dataArray[k];
k -= step;
}
//元素插入到正确位置
dataArray[k + step] = temp;
}
}
}
上面所有的算法示例在排序一个int类型的数组时,是正常可用的。但是很多都有优化的空间(比如看到一篇博客中对插入法排序写了多种实现方法),而且使用临时变量来交换两个值的过程也值得思考。
总结:以上排序算法只是提供一种思想,在我们面临遍历大量数据、从大量数据中查找某个值等问题的时候,其中的某些点是可以借鉴的。其中的分段、构建二叉树的思想是很值得学习的,以此告诫自己思维不要太刻板。