天天看点

内部排序算法:归并排序

基本思想

n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果:

初始状态:无序区为r[1..n],有序区为空。

第1趟排序: 在无序区r[1..n]中选出关键字最小的记录r[k],将它与无序区的第1个记录r[1] 交换,使r[1..1]和r[2..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。

……

第i趟排序: 第i趟排序开始时,当前有序区和无序区分别为r[1..i-1]和r[i..n](1≤i≤n-1)。 该趟排序从当前无序区中选出关键字最小的记录r[k],将它与无序区的第1个记录r[i]交换,使r[1..i] 和r[i+1..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。

这样,n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果。

算法实现

归并排序算法,java实现,代码如下所示:

<code>01</code>

<code>public</code> <code>abstract</code> <code>class</code> <code>sorter {</code>

<code>02</code>

<code></code><code>public</code> <code>abstract</code> <code>void</code> <code>sort(</code><code>int</code><code>[] array);</code>

<code>03</code>

<code>}</code>

<code>04</code>

<code>05</code>

<code>public</code> <code>class</code> <code>mergesorter</code><code>extends</code> <code>sorter {</code>

<code>06</code>

<code>07</code>

<code></code><code>@override</code>

<code>08</code>

<code></code><code>public</code> <code>void</code> <code>sort(</code><code>int</code><code>[] array) {</code>

<code>09</code>

<code></code><code>int</code><code>[] auxarray =</code><code>new</code> <code>int</code><code>[array.length];</code>

<code>10</code>

<code></code><code>mergesort(array, auxarray,</code><code>0</code><code>, array.length -</code><code>1</code><code>);</code>

<code>11</code>

<code></code><code>}</code>

<code>12</code>

<code>13</code>

<code></code><code>/**</code>

<code>14</code>

<code></code><code>* 基于分治思想,执行归并排序</code>

<code>15</code>

<code></code><code>* @param low 待排序数组下标下界</code>

<code>16</code>

<code></code><code>* @param high 待排序数组下标上界</code>

<code>17</code>

<code></code><code>*/</code>

<code>18</code>

<code></code><code>private</code> <code>void</code> <code>mergesort(</code><code>int</code><code>[] array,</code><code>int</code><code>[] auxarray,</code><code>int</code> <code>low,</code><code>int</code> <code>high) {</code>

<code>19</code>

<code></code><code>int</code> <code>dividedindex =</code><code>0</code><code>;</code><code>// 分治位置索引变量</code>

<code>20</code>

<code></code><code>if</code> <code>(low &lt; high) {</code>

<code>21</code>

<code></code><code>dividedindex = (low + high) /</code><code>2</code><code>;</code><code>// 计算分治位置(采用简单的二分思想)</code>

<code>22</code>

<code></code><code>mergesort(array, auxarray, low, dividedindex);</code><code>// 左侧递归归并排序</code>

<code>23</code>

<code></code><code>mergesort(array, auxarray, dividedindex +</code><code>1</code><code>, high);</code><code>// 右侧递归归并排序</code>

<code>24</code>

<code></code><code>merge(array, auxarray, low, dividedindex, high);</code><code>// 合并分治结果</code>

<code>25</code>

<code>26</code>

<code>27</code>

<code>28</code>

<code></code><code>private</code> <code>void</code> <code>merge(</code><code>int</code><code>[] array,</code><code>int</code><code>[] auxarray,</code><code>int</code> <code>low,</code><code>int</code> <code>dividedindex,</code><code>int</code><code>high) {</code>

<code>29</code>

<code></code><code>int</code> <code>i = low;</code><code>// 指向左半分区数组的指针</code>

<code>30</code>

<code></code><code>int</code> <code>j = dividedindex +</code><code>1</code><code>;</code><code>// 指向右半分区数组的指针</code>

<code>31</code>

<code></code><code>int</code> <code>auxptr =</code><code>0</code><code>;</code><code>// 指向辅助区数组的指针</code>

<code>32</code>

<code></code><code>// 合并两个有序数组:array[low..dividedindex]与array[dividedindex+1..high]。</code>

<code>33</code>

<code></code><code>while</code> <code>(i &lt;= dividedindex &amp;&amp; j &lt;= high) {</code><code>// 将两个有序的数组合并,排序到辅助数组auxarray中</code>

<code>34</code>

<code></code><code>if</code> <code>(array[i] &gt; array[j]) {</code><code>// 左侧数组array[low..dividedindex]中的array[i]大于右侧数组array[dividedindex+1..high]中的array[j]</code>

<code>35</code>

<code></code><code>auxarray[auxptr++] = array[j++];</code>

<code>36</code>

<code></code><code>}</code><code>else</code> <code>{</code>

<code>37</code>

<code></code><code>auxarray[auxptr++] = array[i++];</code>

<code>38</code>

<code>39</code>

<code>40</code>

<code></code><code>// 如果array[low..dividedindex].length&gt;array[dividedindex+1..high].length,经过上面合并</code>

<code>41</code>

<code></code><code>// array[low..dividedindex]没有合并完,则直接将array[low..dividedindex]中没有合并的元素复制到辅助数组auxarray中去</code>

<code>42</code>

<code></code><code>while</code> <code>(i &lt;= dividedindex) {</code>

<code>43</code>

<code>44</code>

<code>45</code>

<code></code><code>// 如果array[low..dividedindex].length&lt;array[dividedindex+1..high].length,经过上面合并</code>

<code>46</code>

<code></code><code>// array[dividedindex+1..high]没有合并完,则直接将array[dividedindex+1..high]中没有合并的元素复制到辅助数组auxarray中去</code>

<code>47</code>

<code></code><code>while</code> <code>(j &lt;= high) {</code>

<code>48</code>

<code>49</code>

<code>50</code>

<code></code><code>// 最后把辅助数组auxarray的元素复制到原来的数组中去,归并排序结束</code>

<code>51</code>

<code></code><code>for</code> <code>(auxptr =</code><code>0</code><code>, i = low; i &lt;= high; i++, auxptr++) {</code>

<code>52</code>

<code></code><code>array[i] = auxarray[auxptr];</code>

<code>53</code>

<code>54</code>

<code>55</code>

归并排序算法,python实现,代码如下所示:

<code>class</code> <code>sorter:</code>

<code></code><code>'''</code>

<code></code><code>abstract sorter class, which provides shared methods being used by</code>

<code></code><code>subclasses.</code>

<code></code><code>__metaclass__</code><code>=</code> <code>abcmeta</code>

<code></code>

<code></code><code>@abstractmethod</code>

<code></code><code>def</code> <code>sort(</code><code>self</code><code>, array):</code>

<code></code><code>pass</code>

<code>class</code> <code>mergesorter(sorter):</code>

<code></code><code>merge sorter</code>

<code></code><code>length</code><code>=</code> <code>len</code><code>(array)</code>

<code></code><code># initialize auxiliary list</code>

<code></code><code>auxiliary_list</code><code>=</code> <code>[</code><code>0</code> <code>for</code> <code>x</code><code>in</code> <code>range</code><code>(length)]</code>

<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list,</code><code>0</code><code>, length</code><code>-</code> <code>1</code><code>)</code>

<code></code><code>def</code> <code>__merge_sort(</code><code>self</code><code>, array, auxiliary_list, low, high):</code>

<code></code><code>dividedindex</code><code>=</code> <code>0</code>

<code></code><code>if</code> <code>low&lt;high:</code>

<code></code><code>dividedindex</code><code>=</code> <code>(low</code><code>+</code> <code>high)</code><code>/</code><code>/</code> <code>2</code>

<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list, low, dividedindex)</code>

<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list, dividedindex</code><code>+</code> <code>1</code><code>, high)</code>

<code></code><code>self</code><code>.__merge(array, auxiliary_list, low, dividedindex, high)</code>

<code></code><code>def</code> <code>__merge(</code><code>self</code><code>, array, auxiliary_list, low, dividedindex, high):</code>

<code></code><code>i</code><code>=</code> <code>low</code>

<code></code><code>j</code><code>=</code> <code>dividedindex</code><code>+</code> <code>1</code>

<code></code><code>pointer</code><code>=</code> <code>0</code>

<code></code><code>while</code> <code>i&lt;</code><code>=</code><code>dividedindex</code><code>and</code> <code>j&lt;</code><code>=</code><code>high:</code>

<code></code><code>if</code> <code>array[i]&gt;array[j]:</code>

<code></code><code>auxiliary_list[pointer]</code><code>=</code> <code>array[j]</code>

<code></code><code>j</code><code>=</code> <code>j</code><code>+</code> <code>1</code>

<code></code><code>else</code><code>:</code>

<code></code><code>auxiliary_list[pointer]</code><code>=</code> <code>array[i]</code>

<code></code><code>i</code><code>=</code> <code>i</code><code>+</code> <code>1</code>

<code></code><code>pointer</code><code>=</code> <code>pointer</code><code>+</code> <code>1</code>

<code></code><code>while</code> <code>i&lt;</code><code>=</code><code>dividedindex:</code>

<code></code><code>while</code> <code>j&lt;</code><code>=</code><code>high:</code>

<code></code><code># copy elements in auxiliary list to the original list</code>

<code></code><code>while</code> <code>i&lt;</code><code>=</code><code>high:</code>

<code></code><code>array[i]</code><code>=</code> <code>auxiliary_list[pointer]</code>

<code>56</code>

<code>57</code>

排序过程

假设待排序数组为array = {94,12,34,76,26,9,0,37,55,76,37,5,68,83,90,37,12,65,76,49},数组大小为20,我们以该数组为例,执行归并排序的具体过程,如下所示:

<code>[94,12,34,76,26,9,0,37,55,76, 37,5,68,83,90,37,12,65,76,49]</code>

<code>[94,12,34,76,26, 9,0,37,55,76]</code>

<code>[94,12,34, 76,26]</code>

<code>[94,12, 34]</code>

<code>[94, 12]</code>

<code>{12, 94}</code>

<code>{12,34, 94}</code>

<code>[76, 26]</code>

<code>{26, 76}</code>

<code>{12,26,34, 76,94}</code>

<code>[9,0,37, 55,76]</code>

<code>[9,0, 37]</code>

<code>[9, 0]</code>

<code>{0, 9}</code>

<code>{0,9, 37}</code>

<code>[55, 76]</code>

<code>{55, 76}</code>

<code>{0,9,37, 55,76}</code>

<code>{0,9,12,26,34, 37,55,76,76,94}</code>

<code>[37,5,68,83,90, 37,12,65,76,49]</code>

<code>[37,5,68, 83,90]</code>

<code>[37,5, 68]</code>

<code>[37, 5]</code>

<code>{5, 37}</code>

<code>{5,37, 68}</code>

<code>[83, 90]</code>

<code>{83, 90}</code>

<code>{5,37,68, 83,90}</code>

<code>[37,12,65, 76,49]</code>

<code>[37,12, 65]</code>

<code>[37, 12 ]</code>

<code>{12, 37 }</code>

<code>{12,37, 65 }</code>

<code>[76, 49 ]</code>

<code>{49, 76}</code>

<code>{12,37,49, 65,76}</code>

<code>{5,12,37,37,49, 65,68,76,83,90}</code>

<code>{0,5,9,12,12,26,34,37,37,37, 49,55,65,68,76,76,76,83,90,94}</code>

上面示例的排序过程中,方括号表示“分解”操作过程中,将原始数组进行递归分解,直到不能再继续分割为止;花括号表示“归并”的过程,将上一步分解后的数组进行归并排序。因为采用递归分治的策略,所以从上面的排序过程可以看到,“分解”和“归并”交叉出现。

算法分析

时间复杂度

对长度为n的文件,需进行floor(logn) 趟二路归并,每趟归并的时间为o(n),故其时间复杂度无论是在最好情况下还是在最坏情况下均是o(nlgn)。

空间复杂度

需要一个辅助向量来暂存两有序子文件归并的结果,故其辅助空间复杂度为o(n),显然它不是就地排序。

排序稳定性

归并排序是一种稳定的排序。

继续阅读