内部排序算法：归并排序

基本思想

n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果：

初始状态：无序区为r[1..n]，有序区为空。

第1趟排序: 在无序区r[1..n]中选出关键字最小的记录r[k]，将它与无序区的第1个记录r[1] 交换，使r[1..1]和r[2..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。

……

第i趟排序: 第i趟排序开始时，当前有序区和无序区分别为r[1..i-1]和r[i..n](1≤i≤n-1)。该趟排序从当前无序区中选出关键字最小的记录r[k]，将它与无序区的第1个记录r[i]交换，使r[1..i] 和r[i+1..n]分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。

这样，n个记录的文件的直接选择排序可经过n-1趟直接选择排序得到有序结果。

算法实现

归并排序算法，java实现，代码如下所示：

<code>public</code> <code>abstract</code> <code>class</code> <code>sorter {</code>

<code></code><code>public</code> <code>abstract</code> <code>void</code> <code>sort(</code><code>int</code><code>[] array);</code>

<code>public</code> <code>class</code> <code>mergesorter</code><code>extends</code> <code>sorter {</code>

<code></code><code>@override</code>

<code></code><code>public</code> <code>void</code> <code>sort(</code><code>int</code><code>[] array) {</code>

<code></code><code>int</code><code>[] auxarray =</code><code>new</code> <code>int</code><code>[array.length];</code>

<code></code><code>mergesort(array, auxarray,</code><code>0</code><code>, array.length -</code><code>1</code><code>);</code>

<code></code><code>* 基于分治思想，执行归并排序</code>

<code></code><code>* @param low 待排序数组下标下界</code>

<code></code><code>* @param high 待排序数组下标上界</code>

<code></code><code>private</code> <code>void</code> <code>mergesort(</code><code>int</code><code>[] array,</code><code>int</code><code>[] auxarray,</code><code>int</code> <code>low,</code><code>int</code> <code>high) {</code>

<code></code><code>int</code> <code>dividedindex =</code><code>0</code><code>;</code><code>// 分治位置索引变量</code>

<code></code><code>dividedindex = (low + high) /</code><code>2</code><code>;</code><code>// 计算分治位置(采用简单的二分思想)</code>

<code></code><code>mergesort(array, auxarray, low, dividedindex);</code><code>// 左侧递归归并排序</code>

<code></code><code>mergesort(array, auxarray, dividedindex +</code><code>1</code><code>, high);</code><code>// 右侧递归归并排序</code>

<code></code><code>merge(array, auxarray, low, dividedindex, high);</code><code>// 合并分治结果</code>

<code></code><code>private</code> <code>void</code> <code>merge(</code><code>int</code><code>[] array,</code><code>int</code><code>[] auxarray,</code><code>int</code> <code>low,</code><code>int</code> <code>dividedindex,</code><code>int</code><code>high) {</code>

<code></code><code>int</code> <code>i = low;</code><code>// 指向左半分区数组的指针</code>

<code></code><code>int</code> <code>j = dividedindex +</code><code>1</code><code>;</code><code>// 指向右半分区数组的指针</code>

<code></code><code>int</code> <code>auxptr =</code><code>0</code><code>;</code><code>// 指向辅助区数组的指针</code>

<code></code><code>// 合并两个有序数组：array[low..dividedindex]与array[dividedindex+1..high]。</code>

<code></code><code>while</code> <code>(i <= dividedindex && j <= high) {</code><code>// 将两个有序的数组合并，排序到辅助数组auxarray中</code>

<code></code><code>if</code> <code>(array[i] > array[j]) {</code><code>// 左侧数组array[low..dividedindex]中的array[i]大于右侧数组array[dividedindex+1..high]中的array[j]</code>

<code></code><code>auxarray[auxptr++] = array[j++];</code>

<code></code><code>auxarray[auxptr++] = array[i++];</code>

<code></code><code>// 如果array[low..dividedindex].length>array[dividedindex+1..high].length，经过上面合并</code>

<code></code><code>// array[low..dividedindex]没有合并完，则直接将array[low..dividedindex]中没有合并的元素复制到辅助数组auxarray中去</code>

<code></code><code>while</code> <code>(i <= dividedindex) {</code>

<code></code><code>// 如果array[low..dividedindex].length<array[dividedindex+1..high].length，经过上面合并</code>

<code></code><code>// array[dividedindex+1..high]没有合并完，则直接将array[dividedindex+1..high]中没有合并的元素复制到辅助数组auxarray中去</code>

<code></code><code>while</code> <code>(j <= high) {</code>

<code></code><code>// 最后把辅助数组auxarray的元素复制到原来的数组中去，归并排序结束</code>

<code></code><code>for</code> <code>(auxptr =</code><code>0</code><code>, i = low; i <= high; i++, auxptr++) {</code>

<code></code><code>array[i] = auxarray[auxptr];</code>

归并排序算法，python实现，代码如下所示：

<code>class</code> <code>sorter:</code>

<code></code><code>abstract sorter class, which provides shared methods being used by</code>

<code></code><code>subclasses.</code>

<code></code><code>__metaclass__</code><code>=</code> <code>abcmeta</code>

<code></code><code>@abstractmethod</code>

<code></code><code>def</code> <code>sort(</code><code>self</code><code>, array):</code>

<code>class</code> <code>mergesorter(sorter):</code>

<code></code><code>merge sorter</code>

<code></code><code>length</code><code>=</code> <code>len</code><code>(array)</code>

<code></code><code># initialize auxiliary list</code>

<code></code><code>auxiliary_list</code><code>=</code> <code>[</code><code>0</code> <code>for</code> <code>x</code><code>in</code> <code>range</code><code>(length)]</code>

<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list,</code><code>0</code><code>, length</code><code>-</code> <code>1</code><code>)</code>

<code></code><code>def</code> <code>__merge_sort(</code><code>self</code><code>, array, auxiliary_list, low, high):</code>

<code></code><code>dividedindex</code><code>=</code> <code>0</code>

<code></code><code>dividedindex</code><code>=</code> <code>(low</code><code>+</code> <code>high)</code><code>/</code><code>/</code> <code>2</code>

<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list, low, dividedindex)</code>

<code></code><code>self</code><code>.__merge_sort(array, auxiliary_list, dividedindex</code><code>+</code> <code>1</code><code>, high)</code>

<code></code><code>self</code><code>.__merge(array, auxiliary_list, low, dividedindex, high)</code>

<code></code><code>def</code> <code>__merge(</code><code>self</code><code>, array, auxiliary_list, low, dividedindex, high):</code>

<code></code><code>j</code><code>=</code> <code>dividedindex</code><code>+</code> <code>1</code>

<code></code><code>pointer</code><code>=</code> <code>0</code>

<code></code><code>while</code> <code>i<</code><code>=</code><code>dividedindex</code><code>and</code> <code>j<</code><code>=</code><code>high:</code>

<code></code><code>if</code> <code>array[i]>array[j]:</code>

<code></code><code>auxiliary_list[pointer]</code><code>=</code> <code>array[j]</code>

<code></code><code>auxiliary_list[pointer]</code><code>=</code> <code>array[i]</code>

<code></code><code>pointer</code><code>=</code> <code>pointer</code><code>+</code> <code>1</code>

<code></code><code>while</code> <code>i<</code><code>=</code><code>dividedindex:</code>

<code></code><code>while</code> <code>j<</code><code>=</code><code>high:</code>

<code></code><code># copy elements in auxiliary list to the original list</code>

<code></code><code>while</code> <code>i<</code><code>=</code><code>high:</code>

<code></code><code>array[i]</code><code>=</code> <code>auxiliary_list[pointer]</code>

排序过程

假设待排序数组为array = {94,12,34,76,26,9,0,37,55,76,37,5,68,83,90,37,12,65,76,49}，数组大小为20，我们以该数组为例，执行归并排序的具体过程，如下所示：

上面示例的排序过程中，方括号表示“分解”操作过程中，将原始数组进行递归分解，直到不能再继续分割为止；花括号表示“归并”的过程，将上一步分解后的数组进行归并排序。因为采用递归分治的策略，所以从上面的排序过程可以看到，“分解”和“归并”交叉出现。

算法分析

时间复杂度

对长度为n的文件，需进行floor(logn) 趟二路归并，每趟归并的时间为o(n)，故其时间复杂度无论是在最好情况下还是在最坏情况下均是o(nlgn)。

空间复杂度

需要一个辅助向量来暂存两有序子文件归并的结果，故其辅助空间复杂度为o(n)，显然它不是就地排序。

排序稳定性

归并排序是一种稳定的排序。

内部排序算法：归并排序

继续阅读

Apache Flink Meetup，1.13 新版本发布 x 互娱场景实践分享的开发者盛筵！

实时数仓的演进之路1. 业务背景2.典型实时数仓诉求3. 实时数仓架构4. 基于Hologres的最佳实践5. 未来展望

开发者玩转机器学习不能错过的15篇深度文章！

白话Elasticsearch22- 深度探秘搜索技术之match_phrase_prefix实现search-time搜索推荐

《推荐系统》--混合推荐、解释及如何评估推荐系统混合推荐方法推荐系统的解释评估推荐系统案例分析：移动互联网个性化游戏推荐

《推荐系统》--基于知识的推荐概述知识表示法和推理与基于约束推荐系统交互与基于实例的推荐系统交互小结

前端性能优化之函数防抖

ElasticSearch（ES）倒排索引原理

下方进我的商品橱窗看看真便宜。今晚8点，淘宝天猫618正式开卖。记者从淘宝天猫处获悉，从首页展示到搜索推荐提升，从榜单推

es的几个骚操作

技术解密｜阿里云多媒体 AI 团队是凭借什么拿下 CVPR2021 5冠1亚的？顶级挑战赛战绩显赫四大挑战的关键技术探索基于视频理解技术打造多媒体 AI 云产品

算法专家解读 | 开放搜索教育搜题能力和实践

企业上云的智能指挥官——混合云管理平台

快手搜索推荐算法的原理。在快手搜索中，除了热门推荐外，还有一个庞大的流量池。这个流量池不仅限于头部作者，普通作者的作品也

当前音乐推荐系统研究中的挑战和愿景摘要1. 介绍2. 重大的挑战3. 未来方向和愿景

MovieTaster-使用Item2Vec做电影推荐 MovieTaster-使用Item2Vec做电影推荐