在初次接触排序算法稳定性这个概念时,我一直认为复杂度为o(n2)的算法是稳定的,复杂度为o(nlogn)的算法是不稳定的。当时是这样理解的,复杂度为o(n2)的算法不可能再坏,而复杂度为o(nlogn)的算法在极端情况下可能会退化为o(n2),例如快速排序。但其实这是错误的,稳定性的概念远没有这么复杂,它只表示两个值相同的元素在排序前后是否有位置变化。如果前后位置变化,则排序算法是稳定的,否则是不稳定的。稳定性的定义符合常理,两个值相同的元素无需再次交换位置,交换位置是做了一次无用功。
之前对稳定性这个概念认识很浅,只停留在知道这个名词的层次上,直到最近写代码遇到一个诡异的现象才让我对稳定性有了更深刻的认识。我现在需要对大量数据进行排序,数据范围有限。针对数据量的大小,可以选择快速排序和基数排序(可参考:)。在此基础上,每一个数据都还伴随有一个属性,在排序过程中也要随之移动这个属性数据。一种可行方案是将数据和属性构成一个结构体,然后对结构体进行排序。在排序的过程中只有指针的移动,没有实际结构体的移动。这种方案涉及间接寻址,对现有代码改动较大,没有采用。
我采用的方案是在原始快速排序和基数排序基础上做修改,每当出现元素交换时,就将对应的属性也进行交换。按这种思路实现的快速排序代码如下:
上述代码的结构很简单,就是在快排基础上增加属性元素的交换。基数排序代码如下:
基数排序代码稍微有点复杂,需要重新开辟一个新的数组存放属性数据,但是思想还是在交换原始元素的同时交换属性元素。虽然思想很简单,但是还是对自己的实现心存疑虑,同时写了一个验证函数,验证最后的结果是否一致(最初的想法是如果正确实现则原始元素是排好序的,同时两种排序算法的属性元素也应该一致):
完成上面的代码,就可以开始测试。首先测试数组长度小于100时,没有问题,很沾沾自喜。然后测试1000,第一次没问题,重复测试就报错了。很奇怪,多次测试时有正确有错误,一时搞不清楚到底怎么回事。开始认为应该代码有bug,但是仔细debug了一天也没有搞明白到底哪个地方出错了。后来,换了一个思路:快排和基数排序都属于比较高级的排序,我找个最笨的排序先保证正确性,然后去和快排、基数排序比较。之后按照这个思路把冒泡排序的算法实现了:
对于快排和基数排序,我开始认为是基数排序的算法实现错了,毕竟这个算法是首次使用。但是结果令我吃惊:冒泡排序的结果和基数排序的结果完全一致,反倒是快速排序和冒泡排序的结果不一致!太出乎意料了,问题找了半天没想到是出在自己擅长的快排上面。快排怎么可能会出错呢,毕竟用了这么久。很长时间内我也没有找到问题所在。后来我将equals方法修改了下,去掉return,把所有不匹配的数据都打印出来,一打印终于发现问题所在!

打印结果显示,错误总是出在两个值相同的元素间,一瞬间就明白怎么回事了:快速排序是不稳定排序,它可能会交换两个值相同的元素,所以这根本就不是一个bug。没想到debug两天原来是做的无用功。
为了能汲取教训,我又仔细分析了一下为什么快排是不稳定排序。出现不稳定的关键是两个do-while循环:
两个循环在进行元素比较时,分别用了小于和大于操作(也可以改用小于等于和大于等于,但是对性能没有影响)。这就意味着如果出现和pivot值相同的元素,它都会被作为交换对象而移动到pivot的前面或者后面,这就出现了值相同的元素会交换顺序的问题,因而是不稳定的。