胜者树与败者树

胜者树和败者树都是完全二叉树，是树形选择排序的一种变型。每个叶子结点相当于一个选手，每个中间结点相当于一场比赛，每一层相当于一轮比赛。

不同的是，胜者树的中间结点记录的是胜者的标号；而败者树的中间结点记录的败者的标号。

胜者树与败者树可以在log(n)的时间内找到最值。任何一个叶子结点的值改变后，利用中间结点的信息，还是能够快速地找到最值。在k路归并排序中经常用到。

一、胜者树

胜者树的一个优点是，如果一个选手的值改变了，可以很容易地修改这棵胜者树。只需要沿着从该结点到根结点的路径修改这棵二叉树，而不必改变其他比赛的结果。

fig. 1

fig.1是一个胜者树的示例。规定数值小者胜。

1. b3 pk b4，b3胜b4负，内部结点ls[4]的值为3；

2. b3 pk b0，b3胜b0负，内部结点ls[2]的值为3；

3. b1 pk b2，b1胜b2负，内部结点ls[3]的值为1；

4. b3 pk b1，b3胜b1负，内部结点ls[1]的值为3。.

当fig. 1中叶子结点b3的值变为11时，重构的胜者树如fig. 2所示。

2. b3 pk b0，b0胜b3负，内部结点ls[2]的值为0；

4. b0 pk b1，b1胜b0负，内部结点ls[1]的值为1。.

fig. 2

二、败者树

败者树是胜者树的一种变体。在败者树中，用父结点记录其左右子结点进行比赛的败者，而让胜者参加下一轮的比赛。败者树的根结点记录的是败者，需要加一个结点来记录整个比赛的胜利者。采用败者树可以简化重构的过程。

fig. 3

fig. 3是一棵败者树。规定数大者败。

1. b3 pk b4，b3胜b4负，内部结点ls[4]的值为4；

2. b3 pk b0，b3胜b0负，内部结点ls[2]的值为0；

3. b1 pk b2，b1胜b2负，内部结点ls[3]的值为2；

4. b3 pk b1，b3胜b1负，内部结点ls[1]的值为1；

5. 在根结点ls[1]上又加了一个结点ls[0]=3，记录的最后的胜者。

败者树重构过程如下：

· 将新进入选择树的结点与其父结点进行比赛：将败者存放在父结点中；而胜者再与上一级的父结点比较。

· 比赛沿着到根结点的路径不断进行，直到ls[1]处。把败者存放在结点ls[1]中，胜者存放在ls[0]中。

fig. 4

fig. 4是当b3变为13时，败者树的重构图。

注意，败者树的重构跟胜者树是不一样的，败者树的重构只需要与其父结点比较。对照fig.

3来看，b3与结点ls[4]的原值比较，ls[4]中存放的原值是结点4，即b3与b4比较，b3负b4胜，则修改ls[4]的值为结点3。同理，以此

类推，沿着根结点不断比赛，直至结束。

由上可知，败者树简化了重构。败者树的重构只是与该结点的父结点的记录有关，而胜者树的重构还与该结点的兄弟结点有关。

一外部排序的基本思路

假设有一个72kb的文件，其中存储了18k个整数，磁盘中物理块的大小为4kb，将文件分成18组，每组刚好4kb。

首先通过18次内部排序，把18组数据排好序，得到初始的18个归并段r1~r18，每个归并段有1024个整数。

然后对这18个归并段使用4路平衡归并排序：

第1次归并：产生5个归并段

r11 r12 r13 r14 r15

其中

r11是由{r1,r2,r3,r4}中的数据合并而来

r12是由{r5,r6,r7,r8}中的数据合并而来

r13是由{r9,r10,r11,r12}中的数据合并而来

r14是由{r13,r14,r15,r16}中的数据合并而来

r15是由{r17,r18}中的数据合并而来

把这5个归并段的数据写入5个文件：

foo_1.dat foo_2.dat foo_3.dat foo_4.dat foo_5.dat

第2次归并：从第1次归并产生的5个文件中读取数据，合并，产生2个归并段

r21 r22

其中r21是由{r11,r12,r13,r14}中的数据合并而来

其中r22是由{r15}中的数据合并而来

把这2个归并段写入2个文件

bar_1.dat bar_2.dat

第3次归并：从第2次归并产生的2个文件中读取数据，合并，产生1个归并段

r31

r31是由{r21,r22}中的数据合并而来

把这个文件写入1个文件

foo_1.dat

此即为最终排序好的文件。

参考文章：

<a href="http://blog.csdn.net/whz_zb/article/details/7425152" target="_blank">http://blog.csdn.net/whz_zb/article/details/7425152</a>