基本思想
n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果:
初始状态:无序区为r[1..n],有序区为空。
第1趟排序: 在无序区r[1..n]中选出关键字最小的记录r[k],将它与无序区的第1个记录r[1] 交换,使r[1..1]和r[2..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。
……
第i趟排序: 第i趟排序开始时,当前有序区和无序区分别为r[1..i-1]和r[i..n](1≤i≤n-1)。 该趟排序从当前无序区中选出关键字最小的记录r[k],将它与无序区的第1个记录r[i]交换,使r[1..i] 和r[i+1..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。
这样,n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果。
算法实现
归并排序算法,java实现,代码如下所示:
<code>01</code>
<code>public</code> <code>abstract</code> <code>class</code> <code>sorter {</code>
<code>02</code>
<code></code><code>public</code> <code>abstract</code> <code>void</code> <code>sort(</code><code>int</code><code>[] array);</code>
<code>03</code>
<code>}</code>
<code>04</code>
<code>05</code>
<code>public</code> <code>class</code> <code>mergesorter</code><code>extends</code> <code>sorter {</code>
<code>06</code>
<code>07</code>
<code></code><code>@override</code>
<code>08</code>
<code></code><code>public</code> <code>void</code> <code>sort(</code><code>int</code><code>[] array) {</code>
<code>09</code>
<code></code><code>int</code><code>[] auxarray =</code><code>new</code> <code>int</code><code>[array.length];</code>
<code>10</code>
<code></code><code>mergesort(array, auxarray,</code><code>0</code><code>, array.length -</code><code>1</code><code>);</code>
<code>11</code>
<code></code><code>}</code>
<code>12</code>
<code>13</code>
<code></code><code>/**</code>
<code>14</code>
<code></code><code>* 基于分治思想,执行归并排序</code>
<code>15</code>
<code></code><code>* @param low 待排序数组下标下界</code>
<code>16</code>
<code></code><code>* @param high 待排序数组下标上界</code>
<code>17</code>
<code></code><code>*/</code>
<code>18</code>
<code></code><code>private</code> <code>void</code> <code>mergesort(</code><code>int</code><code>[] array,</code><code>int</code><code>[] auxarray,</code><code>int</code> <code>low,</code><code>int</code> <code>high) {</code>
<code>19</code>
<code></code><code>int</code> <code>dividedindex =</code><code>0</code><code>;</code><code>// 分治位置索引变量</code>
<code>20</code>
<code></code><code>if</code> <code>(low < high) {</code>
<code>21</code>
<code></code><code>dividedindex = (low + high) /</code><code>2</code><code>;</code><code>// 计算分治位置(采用简单的二分思想)</code>
<code>22</code>
<code></code><code>mergesort(array, auxarray, low, dividedindex);</code><code>// 左侧递归归并排序</code>
<code>23</code>
<code></code><code>mergesort(array, auxarray, dividedindex +</code><code>1</code><code>, high);</code><code>// 右侧递归归并排序</code>
<code>24</code>
<code></code><code>merge(array, auxarray, low, dividedindex, high);</code><code>// 合并分治结果</code>
<code>25</code>
<code>26</code>
<code>27</code>
<code>28</code>
<code></code><code>private</code> <code>void</code> <code>merge(</code><code>int</code><code>[] array,</code><code>int</code><code>[] auxarray,</code><code>int</code> <code>low,</code><code>int</code> <code>dividedindex,</code><code>int</code><code>high) {</code>
<code>29</code>
<code></code><code>int</code> <code>i = low;</code><code>// 指向左半分区数组的指针</code>
<code>30</code>
<code></code><code>int</code> <code>j = dividedindex +</code><code>1</code><code>;</code><code>// 指向右半分区数组的指针</code>
<code>31</code>
<code></code><code>int</code> <code>auxptr =</code><code>0</code><code>;</code><code>// 指向辅助区数组的指针</code>
<code>32</code>
<code></code><code>// 合并两个有序数组:array[low..dividedindex]与array[dividedindex+1..high]。</code>
<code>33</code>
<code></code><code>while</code> <code>(i <= dividedindex && j <= high) {</code><code>// 将两个有序的数组合并,排序到辅助数组auxarray中</code>
<code>34</code>
<code></code><code>if</code> <code>(array[i] > array[j]) {</code><code>// 左侧数组array[low..dividedindex]中的array[i]大于右侧数组array[dividedindex+1..high]中的array[j]</code>
<code>35</code>
<code></code><code>auxarray[auxptr++] = array[j++];</code>
<code>36</code>
<code></code><code>}</code><code>else</code> <code>{</code>
<code>37</code>
<code></code><code>auxarray[auxptr++] = array[i++];</code>
<code>38</code>
<code>39</code>
<code>40</code>
<code></code><code>// 如果array[low..dividedindex].length>array[dividedindex+1..high].length,经过上面合并</code>
<code>41</code>
<code></code><code>// array[low..dividedindex]没有合并完,则直接将array[low..dividedindex]中没有合并的元素复制到辅助数组auxarray中去</code>
<code>42</code>
<code></code><code>while</code> <code>(i <= dividedindex) {</code>
<code>43</code>
<code>44</code>
<code>45</code>
<code></code><code>// 如果array[low..dividedindex].length<array[dividedindex+1..high].length,经过上面合并</code>
<code>46</code>
<code></code><code>// array[dividedindex+1..high]没有合并完,则直接将array[dividedindex+1..high]中没有合并的元素复制到辅助数组auxarray中去</code>
<code>47</code>
<code></code><code>while</code> <code>(j <= high) {</code>
<code>48</code>
<code>49</code>
<code>50</code>
<code></code><code>// 最后把辅助数组auxarray的元素复制到原来的数组中去,归并排序结束</code>
<code>51</code>
<code></code><code>for</code> <code>(auxptr =</code><code>0</code><code>, i = low; i <= high; i++, auxptr++) {</code>
<code>52</code>
<code></code><code>array[i] = auxarray[auxptr];</code>
<code>53</code>
<code>54</code>
<code>55</code>
归并排序算法,python实现,代码如下所示:
<code>class</code> <code>sorter:</code>
<code></code><code>'''</code>
<code></code><code>abstract sorter class, which provides shared methods being used by</code>
<code></code><code>subclasses.</code>
<code></code><code>__metaclass__</code><code>=</code> <code>abcmeta</code>
<code></code>
<code></code><code>@abstractmethod</code>
<code></code><code>def</code> <code>sort(</code><code>self</code><code>, array):</code>
<code></code><code>pass</code>
<code>class</code> <code>mergesorter(sorter):</code>
<code></code><code>merge sorter</code>
<code></code><code>length</code><code>=</code> <code>len</code><code>(array)</code>
<code></code><code># initialize auxiliary list</code>
<code></code><code>auxiliary_list</code><code>=</code> <code>[</code><code>0</code> <code>for</code> <code>x</code><code>in</code> <code>range</code><code>(length)]</code>
<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list,</code><code>0</code><code>, length</code><code>-</code> <code>1</code><code>)</code>
<code></code><code>def</code> <code>__merge_sort(</code><code>self</code><code>, array, auxiliary_list, low, high):</code>
<code></code><code>dividedindex</code><code>=</code> <code>0</code>
<code></code><code>if</code> <code>low<high:</code>
<code></code><code>dividedindex</code><code>=</code> <code>(low</code><code>+</code> <code>high)</code><code>/</code><code>/</code> <code>2</code>
<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list, low, dividedindex)</code>
<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list, dividedindex</code><code>+</code> <code>1</code><code>, high)</code>
<code></code><code>self</code><code>.__merge(array, auxiliary_list, low, dividedindex, high)</code>
<code></code><code>def</code> <code>__merge(</code><code>self</code><code>, array, auxiliary_list, low, dividedindex, high):</code>
<code></code><code>i</code><code>=</code> <code>low</code>
<code></code><code>j</code><code>=</code> <code>dividedindex</code><code>+</code> <code>1</code>
<code></code><code>pointer</code><code>=</code> <code>0</code>
<code></code><code>while</code> <code>i<</code><code>=</code><code>dividedindex</code><code>and</code> <code>j<</code><code>=</code><code>high:</code>
<code></code><code>if</code> <code>array[i]>array[j]:</code>
<code></code><code>auxiliary_list[pointer]</code><code>=</code> <code>array[j]</code>
<code></code><code>j</code><code>=</code> <code>j</code><code>+</code> <code>1</code>
<code></code><code>else</code><code>:</code>
<code></code><code>auxiliary_list[pointer]</code><code>=</code> <code>array[i]</code>
<code></code><code>i</code><code>=</code> <code>i</code><code>+</code> <code>1</code>
<code></code><code>pointer</code><code>=</code> <code>pointer</code><code>+</code> <code>1</code>
<code></code><code>while</code> <code>i<</code><code>=</code><code>dividedindex:</code>
<code></code><code>while</code> <code>j<</code><code>=</code><code>high:</code>
<code></code><code># copy elements in auxiliary list to the original list</code>
<code></code><code>while</code> <code>i<</code><code>=</code><code>high:</code>
<code></code><code>array[i]</code><code>=</code> <code>auxiliary_list[pointer]</code>
<code>56</code>
<code>57</code>
排序过程
假设待排序数组为array = {94,12,34,76,26,9,0,37,55,76,37,5,68,83,90,37,12,65,76,49},数组大小为20,我们以该数组为例,执行归并排序的具体过程,如下所示:
<code>[94,12,34,76,26,9,0,37,55,76, 37,5,68,83,90,37,12,65,76,49]</code>
<code>[94,12,34,76,26, 9,0,37,55,76]</code>
<code>[94,12,34, 76,26]</code>
<code>[94,12, 34]</code>
<code>[94, 12]</code>
<code>{12, 94}</code>
<code>{12,34, 94}</code>
<code>[76, 26]</code>
<code>{26, 76}</code>
<code>{12,26,34, 76,94}</code>
<code>[9,0,37, 55,76]</code>
<code>[9,0, 37]</code>
<code>[9, 0]</code>
<code>{0, 9}</code>
<code>{0,9, 37}</code>
<code>[55, 76]</code>
<code>{55, 76}</code>
<code>{0,9,37, 55,76}</code>
<code>{0,9,12,26,34, 37,55,76,76,94}</code>
<code>[37,5,68,83,90, 37,12,65,76,49]</code>
<code>[37,5,68, 83,90]</code>
<code>[37,5, 68]</code>
<code>[37, 5]</code>
<code>{5, 37}</code>
<code>{5,37, 68}</code>
<code>[83, 90]</code>
<code>{83, 90}</code>
<code>{5,37,68, 83,90}</code>
<code>[37,12,65, 76,49]</code>
<code>[37,12, 65]</code>
<code>[37, 12 ]</code>
<code>{12, 37 }</code>
<code>{12,37, 65 }</code>
<code>[76, 49 ]</code>
<code>{49, 76}</code>
<code>{12,37,49, 65,76}</code>
<code>{5,12,37,37,49, 65,68,76,83,90}</code>
<code>{0,5,9,12,12,26,34,37,37,37, 49,55,65,68,76,76,76,83,90,94}</code>
上面示例的排序过程中,方括号表示“分解”操作过程中,将原始数组进行递归分解,直到不能再继续分割为止;花括号表示“归并”的过程,将上一步分解后的数组进行归并排序。因为采用递归分治的策略,所以从上面的排序过程可以看到,“分解”和“归并”交叉出现。
算法分析
时间复杂度
对长度为n的文件,需进行floor(logn) 趟二路归并,每趟归并的时间为o(n),故其时间复杂度无论是在最好情况下还是在最坏情况下均是o(nlgn)。
空间复杂度
需要一个辅助向量来暂存两有序子文件归并的结果,故其辅助空间复杂度为o(n),显然它不是就地排序。
排序稳定性
归并排序是一种稳定的排序。