天天看點

各種排序算法的穩定性問題

首先,排序算法的穩定性大家應該都知道,通俗地講就是能保證排序前2個相等的數其在序列的前後位置順序和排序後它們兩個的前後位置順序相同。在簡單形式化一下,如果Ai = Aj, Ai原來在位置前,排序後Ai還是要在Aj位置前。為了簡便下面讨論的都是不降序排列的情形,對于不升序排列的情形讨論方法和結果完全相同。

    其次,說一下穩定性的好處。排序算法如果是穩定的,那麼從一個鍵上排序,然後再從另一個鍵上排序,第一個鍵排序的結果可以為第二個鍵排序所用。基數排序就是這樣,先按低位排序,逐次按高位排序,低位相同的元素其順序再高位也相同時是不會改變的。另外,如果排序算法穩定,對基于比較的排序算法而言,元素交換的次數可能會少一些(個人感覺,沒有證明)。

    回到主題,現在分析一下常見的排序算法的穩定性,每個都給出簡單的理由。

(1)冒泡排序

     冒泡排序是通過相鄰比較、實時交換、縮小範圍實作排序的。第1次操作n個元素,通過相鄰比較将0~n-1中的最大元素交換到位置n-1上,第2次操作n-1個元素,通過相鄰比較将0~n-2中的最大元素交換到位置n-2上……第n-1次操作2個元素,通過相鄰比較将0~1上的最大元素交換到位置1上完成排序。在相鄰比較時如果兩個元素相等,一般不執行交換操作,是以冒泡排序是一種穩定排序算法。

(2)選擇排序

     選擇排序是通過不斷縮小排序序列長度來實作的。第1次操作n個元素,選擇0~n-1中的最小者交換到位置0上,第2次操作n-1個元素,選擇1~n-1中的最小者交換到位置1上……第n-1次操作2個元素,選擇n-2~n-1上的最小者交換到位置n-2上完成排序。在每次選擇最小元素進行交換時,可能破壞穩定性。這種情況可以描述為:約定要發生交換的位置稱為目前位置,被交換的位置稱為被交換位置,被交換位置上的元素為選中的最小元素。如果目前位置之後和被交換位置之前存在與目前位置相等的元素,執行交換後就破壞了穩定性。如序列5 8 5 2 9,我們知道第一遍選擇第1個元素5會和2交換,那麼原序列中2個5的相對前後順序就被破壞了,是以選擇排序不是一個穩定的排序算法。

(3)插入排序

    插入排序是通過不斷擴大排序序列的長度來實作的。第1次操作1個元素,直接放到位置0上即可;第2次操作2個元素,在0~1上為目前元素找到合适位置并插入;第3次操作3個元素,用在0~2上為目前元素找到合适位置并插入它……第n次操作n個元素,在0~n-1上為目前元素找到合适位置并插入完成排序。讨論元素的插入過程,假設目前是第n次操作,要在0~n-1上為目前元素尋找合适位置,設定一個工作指針初始化為n-1,向前移動工作指針直到遇到一個不大于目前元素的元素,就在這個元素的後面插入目前元素,仔細體會這個插入過程,不難了解插入排序是穩定的。

(4)快速排序

    快速排序有兩個方向,左邊的i下标當a[i] <= a[center]時一直往右走,其中center是中樞元素的數組下标,一般取為目前排序段的第一個元素。而右邊的j下标當a[j] > a[center]時一直往左走。如果i和j都走不動了,這時必有結論a[i] > a[center] >= a[j],我們的目的是将a分成不大于a[center]和大于a[center]的兩個部分,其中前者位于左半部分後者位于右半部分。是以如果i>j(i不能等于j,為什麼?)表明已經分好,否則需要交換兩者。當左右分好時,j指向了左側的最後一個元素,這時需要将a[center]與a[j],交換,這個時侯可能會破壞穩定性。這種情形可以這樣描述:center位置之後j位置前存在與j相等的元素,指向center與j的交換後,穩定性破壞。比如序列為 5 3 3 4 3 8 9 10 11,現在中樞元素5和3(第5個元素,下标從1開始計)交換就會把元素3的穩定性打亂,是以快速排序是一個不穩定的排序算法。

(5)歸并排序

    歸并排序是把序列遞歸地分成短序列,遞歸出口是短序列隻有1個元素(認為直接有序)或者2個序列(1次比較和交換),然後把各個有序的段序列合并成一個有序的長序列,不斷合并直到原序列全部排好序。可以發現,在1個或2個元素時,1個元素不會交換,2個元素如果大小相等也沒有人故意交換,這不會破壞穩定性。那麼,在短的有序序列合并的過程中,穩定是是否受到破壞?沒有,合并過程中我們可以保證如果兩個目前元素相等時,我們把處在前面的序列的元素儲存在結果序列的前面,這樣就保證了穩定性。是以,歸并排序也是穩定的排序算法。

(6)基數排序

    基數排序是按照低位先排序,然後收集;再按照高位排序,然後再收集;依次類推,直到最高位。有時候有些屬性是有優先級順序的,先按低優先級排序,再按高優先級排序,最後的次序就是高優先級高的在前,高優先級相同的低優先級高的在前。基數排序基于分别排序,分别收集,是以其是穩定的排序算法。

(7)希爾排序(shell)

     希爾排序是按照不同步長對元素進行插入排序,當剛開始元素很無序的時候,步長最大,是以插入排序的元素個數很少,速度很快;當元素基本有序了,步長很小,插入排序對于有序的序列效率很高。是以,希爾排序的時間複雜度會比o(n^2)好一些。由于多次插入排序,我們知道一次插入排序是穩定的,不會改變相同元素的相對順序,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,最後其穩定性就會被打亂,是以shell排序是不穩定的。

(8)堆排序

    我們知道基于0序的堆結構,節點i的孩子為2*i+1和2*i+2節點,大頂堆要求父節點大于等于其2個子節點,小頂堆要求父節點小于等于其2個子節點。在一個長為n的序列,堆排序的過程是從第n/2開始和其子節點共3個值選擇最大(大頂堆)或者最小(小頂堆),這3個元素之間的選擇當然不會破壞穩定性。但當為n/2-1, n/2-2, ...1這些個父節點選擇元素時,就會破壞穩定性。有可能第n/2個父節點交換把後面一個元素交換過去了,而第n/2-1個父節點把後面一個相同的元素沒有交換,那麼這2個相同的元素之間的穩定性就被破壞了。是以,堆排序不是穩定的排序算法。

    通過上面的論述不難發現規律:存在不相鄰交換的排序算法一般是不穩定的,相鄰交換的排序算法一般是穩定的;對于相鄰交換的穩定排序算法,通過控制交換條件可以轉換成不穩定排序算法;冒泡、插入、歸并和基數排序是穩定的;選擇、快速、希爾和堆排序是不穩定的。

繼續閱讀