排序算法的介紹
排序也稱排序算法(Sort Algorithm),排序是将一組資料,依指定的順序進行排列的過程。
排序的分類
-
-
内部排序:
指将需要處理的所有資料都加載到内部存儲器中進行排序。
-
外部排序法:
資料量過大,無法全部加載到記憶體中,需要借助外部存儲進行 排序。
- 常見的排序算法分類
Java程式設計:排序算法
算法的時間複雜度
度量一個程式(算法)執行時間的兩種方法
事後統計的方法
這種方法可行, 但是有兩個問題:一是要想對設計的算法的運作性能進行評測,需要實際運作該程式;二是所得時間的統計量依賴于計算機的硬體、軟體等環境因素, 這種方式,要在同一台計算機的相同狀态下運作,才能比較那個算法速度更快。
事前估算的方法
通過分析某個算法的時間複雜度來判斷哪個算法更優.
時間頻度
基本介紹
時間頻度:一個算法花費的時間與算法中語句的執行次數成正比例,哪個算法中語句執行次數多,它花費時間就多。一個算法中的語句執行次數稱為語句頻度或時間頻度。記為T(n)。
舉例說明
比如計算1-100所有數字之和, 我們設計兩種算法:
特點
-
- 忽略常數項
Java程式設計:排序算法 - 忽略低次項
Java程式設計:排序算法 - 忽略系數
Java程式設計:排序算法
時間複雜度定義
-
- 一般情況下,算法中的基本操作語句的重複執行次數是問題規模n的某個函數,用T(n)表示,若有某個輔助函數f(n),使得當n趨近于無窮大時,T(n) / f(n) 的極限值為不等于零的常數,則稱f(n)是T(n)的同數量級函數。記作 T(n)=O( f(n) ),稱O( f(n) ) 為算法的漸進時間複雜度,簡稱時間複雜度。
- T(n) 不同,但時間複雜度可能相同。 如:T(n)=n²+7n+6 與 T(n)=3n²+2n+2 它們的T(n) 不同,但時間複雜度相同,都為O(n²)。
-
計算時間複雜度的方法:
1)用常數1代替運作時間中的所有加法常數 T(n)=n²+7n+6 => T(n)=n²+7n+1
2)修改後的運作次數函數中,隻保留最高階項 T(n)=n²+7n+1 => T(n) = n²
3)去除最高階項的系數 T(n) = n² => T(n) = n² => O(n²)
常見的時間複雜度
-
- 常數階O(1)
- 對數階O(log2n)
- 線性階O(n)
- 線性對數階O(nlog2n)
- 平方階O(n^2)
- 立方階O(n^3)
- k次方階O(n^k)
- 指數階O(2^n)
說明:
常見的算法時間複雜度由小到大依次為:Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)< Ο(nk) <Ο(2n) ,随着問題規模n的不斷增大,上述時間複雜度不斷增大,算法的執行效率越低
從圖中可見,我們應該盡可能避免使用指數階的算法
常數階O(1)
無論代碼執行了多少行,隻要是沒有循環等複雜結構,那這個代碼的時間複雜度就都是O(1)
上述代碼在執行的時候,它消耗的時間并不随着某個變量的增長而增長,那麼無論這類代碼有多長,即使有幾萬幾十萬行,都可以用O(1)來表示它的時間複雜度。
對數階O(log2n)
說明:在while循環裡面,每次都将 i 乘以 2,乘完之後,i 距離 n 就越來越近了。假設循環x次之後,i 就大于 2 了,此時這個循環就退出了,也就是說 2 的 x 次方等于 n,那麼 x = log2n也就是說當循環 log2n 次以後,這個代碼就結束了。是以這個代碼的時間複雜度為:O(log2n) 。 O(log2n) 的這個2 時間上是根據代碼變化的,i = i * 3 ,則是 O(log3n) .
線性階O(n)
說明:這段代碼,for循環裡面的代碼會執行n遍,是以它消耗的時間是随着n的變化而變化的,是以這類代碼都可以用O(n)來表示它的時間複雜度
線性對數階O(nlogN)
說明:線性對數階O(nlogN) 其實非常容易了解,将時間複雜度為O(logn)的代碼循環N遍的話,那麼它的時間複雜度就是 n * O(logN),也就是了O(nlogN)
平方階O(n²)
說明:平方階O(n²) 就更容易了解了,如果把 O(n) 的代碼再嵌套循環一遍,它的時間複雜度就是 O(n²),這段代碼其實就是嵌套了2層n循環,它的時間複雜度就是 O(nn),即 O(n²) 如果将其中一層循環的n改成m,那它的時間複雜度就變成了 O(mn)
立方階O(n³)、K次方階O(n^k)
說明:參考上面的O(n²) 去了解就好了,O(n³)相當于三層n循環,其它的類似
平均時間複雜度和最壞時間複雜度
平均時間複雜度是指所有可能的輸入執行個體均以等機率出現的情況下,該算法的運作時間。
最壞情況下的時間複雜度稱最壞時間複雜度。一般讨論的時間複雜度均是最壞情況下的時間複雜度。 這樣做的原因是:最壞情況下的時間複雜度是算法在任何輸入執行個體上運作時間的界限,這就保證了算法的運作時間不會比最壞情況更長。
平均時間複雜度和最壞時間複雜度是否一緻,和算法有關(如圖:)。
空間複雜度
基本介紹
-
- 類似于時間複雜度的讨論,一個算法的空間複雜度(Space Complexity)定義為該算法所耗費的存儲空間,它也是問題規模n的函數。
- 空間複雜度(Space Complexity)是對一個算法在運作過程中臨時占用存儲空間大小的量度。有的算法需要占用的臨時工作單元數與解決問題的規模n有關,它随着n的增大而增大,當n較大時,将占用較多的存儲單元,例如快速排序和歸并排序算法就屬于這種情況
- 在做算法分析時,主要讨論的是時間複雜度。從使用者使用體驗上看,更看重的程式執行的速度。一些緩存産品(redis, memcache)和算法(基數排序)本質就是用空間換時間.
常用
-
- 冒泡排序
- 選擇排序
- 插入排序
- 希爾排序
- 快速排序
- 歸并排序
- 基數排序
- 堆排序
常用排序算法對比
相關術語解釋:
-
- 穩定:如果a原本在b前面,而a=b,排序之後a仍然在b的前面;
- 不穩定:如果a原本在b的前面,而a=b,排序之後a可能會出現在b的後面;
- 内排序:所有排序操作都在記憶體中完成;
- 外排序:由于資料太大,是以把資料放在磁盤中,而排序通過磁盤和記憶體的資料傳輸才能進行;
- 時間複雜度: 一個算法執行所耗費的時間。
- 空間複雜度:運作完一個程式所需記憶體的大小。
- n: 資料規模
- k: “桶”的個數
- In-place: 不占用額外記憶體
- Out-place: 占用額外記憶體