給定一個數組，找出不在數組中的最小的那個數字

這是在TL讨論中Liu xinyu給出的一個例子，覺得思路挺有啟發的，是以整理記錄一下。

給定一個數組，其内容是一些随機的、不重複的正整數，如：

{4, 23, 1, 8, 9, 21, 6, 12}

要求找出不在數組中出現的最小的那個數，比如這個數組中未在數組中出現的最小值是：2

這個問題實際應用的原型可以是一個ID配置設定系統，其使用一個數組來儲存已配置設定的ID，每次回收就從數組中删除一個元素(O(n))，而配置設定則需要找到最小的那個可用的ID，就是這個算法要做的事情。

這個問題從naive的解法到快速的解法的思路轉換是十分巧妙的，當然，如果之前沒有接觸過類似的題，注意到這個特性應該不是一件很容易的事。

設數組為A，大小為n，下标從1開始，下面是一系列逐漸改進的算法：

一、窮舉查找

一般的問題都可以通過這種很暴力的方式來做，從1到n逐個判斷是否在數組中：

MIN-AVAILABLE-NUM(A, n)

　　for i = 1 to n

　　　　do if i not in A

　　　　　 then return i

return n+1

顯然，這裡的算法複雜度是O(n^2)

二、先排序再二分查找

第一種方法，每次查找都是線性查找，要改進最先想到的自然是二分查找，二分查找的前提是有序，是以：

先排序，用O(nlgn)的快速排序、歸并排序或者堆排序；因為數組中的元素是一些自然數，我們甚至可以使用O(n) 的基數排序，當然，需要更多的記憶體。
對1..n進行判斷，複雜度也為O(nlgn)

是以，整體的算法複雜度為O(nlgn)

三、該數組的一個特性

其實仔細觀察該數組A[1]..A[n]，我們可以得出一個結論：如果該數組中存在未被使用的數，那麼Max(A) > n。

證明很簡單，假設Max(A) <= n，由于該數組大小為n，那麼該數組中的元素隻能是從1到n的某個排列，進而得出該數組中不存在未被使用的數，沖突。

這個特性和抽屜原理有些類似之處。

進而我們可以有另外一個方法：

先排序
再利用該特性搜尋

　　　　do A[i] > i

注意到，如果我們使用基數排序，可以将複雜度降低到O(n)。

四、一個線性時間，線性空間的算法

第三個算法雖然能達到理論意義上的O(n)，但是基數排序隐含的常數因子較大，而且不是原地排序，這裡給出一個不需要排序的算法：

　　　　B[i] = 0

　　　　do if A[i] < n

　　　　　 then B[A[i]] = 1

for i = 1 to n

　　　　if(B[i] == 0) return i;

　　 return n+1;

這裡使用一個輔助數組B來表示1到n這些數是否存在在數組A中，隻要不存在就将其标為0，最後在B中找到第一個值為0的便是我們要找的那個元素；如果B中元素全為1，這說明A使用了所有1到n這些數，那麼傳回的便是下一個n+1.

此處無須排序，且複雜度為O(n)，但需要一個額外的O(n)的數組。

五、一個線性時間、常數空間的算法

利用快速排序的原理，我們可以在不使用額外數組的情況下達到O(n)的效率，原理為：

取1到n的中間值m = (1 + n)/2，用m将數組分成A1, A2兩個部分，A1中的元素全部小于等于m，A2中的元素全部大于m（注意此處用的是下标，而不是A[m]），如果A1的大小為m，則空閑元素在A2中，這在前面證明過，然後就在A2中應用同樣的方法。

MIN-AVAILABLE-NUM(A, low, up)

　　if(low == up) return low

　　m = (low + up) / 2

　　split = partition(A, low, up, m)

　　if a[split] == m

　　 then return MIN-AVAILABLE-NUM(A, low, split)

else return MIN-AVAILABLE-NUM(A, split+1, up)

這裡遞歸式為：T(n) = T(n/2) + O(n)，根據主定理的第三種情況，複雜度為O(n)，其實也就是一個等比數列：n + n/2 + n/4...

但是，此處因為用到遞歸，是以空間複雜度其實是O(Lgn)，是以可以用循環來代替：

　　while low != up

　　　　m = (low + up) / 2

　　　　split = partition(low, up, m)

　　　　if A[split] == m

　　　　　　then low = split + 1

　　　　else up = split - 1

　　　return low

給定一個數組，找出不在數組中的最小的那個數字

繼續閱讀

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

Windows下VS開發環境環境安裝工程項目設定關于Debug和Release的提示

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

Windows下配置Apache的SSL服務

Mac｜Windows系統本地照片自動上傳到伺服器

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希