统计排序
非基于比较的线性时间排序算法
统计排序是一个非基于比较的线性时间排序算法
它对输入的数据有附加的限制条件:
1、输入的线性表的元素属于有限偏序集S;
2、设输入的线性表的长度为n,|S|=k(表示集合S中元素的总数目为k),则k=O(n)。
在这两个条件下,统计排序的复杂性为O(n)。
统计排序算法的基本思想是对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。例如,如果输入序列中只有17个元素的值小于x的值,则x可以直接存放在输出序列的第18个位置上。当然,如果有多个元素具有相同的值时,我们不能将这些元素放在输出序列的同一个位置上,因此,上述方案还要作适当的修改。
假设输入的线性表L的长度为n,L=L1,L2,..,Ln;线性表的元素属于有限偏序集S,|S|=k且k=O(n),S={S1,S2,..Sk};则统计排序算法可以描述如下:
扫描整个集合S,对每一个Si∈S,找到在线性表L中小于等于Si的元素的个数T(Si);
扫描整个线性表L,对L中的每一个元素Li,将Li放在输出线性表的第T(Li)个位置上,并将T(Li)减1。
具体的实现如下:
void Counting_Sort(int a[], int b[], int l, int k)
...{
int* c = new int[k];
memset(c, 0, k * sizeof(int));
for (int j = 0; j < l; j++) c[a[j]]++;
for (int j = 1; j < k; j++) c[j] += c[j - 1];
for (int j = l - 1; j >= 0; j--)
...{
b[c[a[j]] - 1] = a[j];
c[a[j]]--;
}
delete []c;
}
其中a为输入,b为输出,l为元素个数,k为元素最大值。
我们看到,统计排序算法没有用到元素间的比较,它利用元素的实际值来确定它们在输出数组中的位置。因此,统计排序算法不是一个基于比较的排序算法,从而它的计算时间下界不再是Ω(nlogn)。另一方面,统计排序算法之所以能取得线性计算时间的上界是因为对元素的取值范围作了一定限制,即k=O(n)。如果k=n2,n3,..,就得不到线性时间的上界。此外,我们还看到,由于算法第4行使用了downto语句,经统计排序,输出序列中值相同的元素之间的相对次序与他们在输入序列中的相对次序相同,换句话说,统计排序算法是一个稳定的排序算法。
参考资料
最新修订时间:2024-05-21 14:11
目录
概述
参考资料