天天看点

查找一 线性表的查找查找的基本概念顺序查找二分查找分块查找三种线性查找的PK

什么是查找?

查找是根据给定的某个值,在表中确定一个关键字的值等于给定值的记录或数据元素。

查找算法的分类

若在查找的同时对表记录做修改操作(如插入和删除),则相应的表称之为动态查找表;

否则,称之为静态查找表。

此外,如果查找的全过程都在内存中进行,称之为内查找;

反之,如果查找过程中需要访问外存,称之为外查找。

查找算法性能比较的标准

——平均查找长度ASL(Average Search Length)

由于查找算法的主要运算是关键字的比较过程,所以通常把查找过程中对关键字需要执行的平均比较长度(也称为平均比较次数)作为衡量一个查找算法效率优劣的比较标准。

选取查找算法的因素

(1) 使用什么数据存储结构(如线性表、树形表等)。

(2) 表中的次序,即对无序表还是有序表进行查找。

要点

它是一种最简单的查找算法,效率也很低下。

存储结构

没有存储结构要求,可以无序,也可以有序。

基本思想

从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示查找成功;

若扫描结束仍没有找到关键字等于k的结点,表示查找失败。

核心代码

<a></a>

public int orderSearch(int[] list, int length, int key) {

    // 从前往后扫描list数组,如果有元素的值与key相等,直接返回其位置

    for (int i = 0; i &lt; length; i++) {

        if (key == list[i]) {

            return i;

        }

    }

    // 如果扫描完,说明没有元素的值匹配key,返回-1,表示查找失败

    return -1;

}

算法分析

顺序查找算法最好的情况是,第一个记录即匹配关键字,则需要比较 1 次;

最坏的情况是,最后一个记录匹配关键字,则需要比较 N 次。

所以,顺序查找算法的平均查找长度为

ASL = (N + N-1 + ... + 2 + 1) / N = (N+1) / 2

顺序查找的平均时间复杂度为O(N)。

二分查找又称折半查找,它是一种效率较高的查找方法。

使用二分查找需要两个前提:

(1) 必须是顺序存储结构。

(2) 必须是有序的表。

首先,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;

否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。

重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。

public int binarySearch(int[] list, int length, int key) {

    int low = 0, mid = 0, high = length - 1;

    while (low &lt;= high) {

        mid = (low + high) / 2;

        if (list[mid] == key) {

            return mid; // 查找成功,直接返回位置

        } else if (list[mid] &lt; key) {

            low = mid + 1; // 关键字大于中间位置的值,则在大值区间[mid+1, high]继续查找

        } else {

            high = mid - 1; // 关键字小于中间位置的值,则在小值区间[low, mid-1]继续查找

二分查找的过程可看成一个二叉树。

把查找区间的中间位置视为树的根,左区间和右区间视为根的左子树和右子树。

由此得到的二叉树,称为二分查找的判定树或比较树。

由此可知,二分查找的平均查找长度实际上就是树的高度O(log2N)。

分块查找(Blocking Search)又称索引顺序查找。它是一种性能介于顺序查找和二分查找之间的查找方法。

分块查找由于只要求索引表是有序的,对块内节点没有排序要求,因此特别适合于节点动态变化的情况。

分块查找表是由“分块有序”的线性表和索引表两部分构成的。

所谓“分块有序”的线性表,是指:

假设要排序的表为R[0...N-1],将表均匀分成b块,前b-1块中记录个数为s=N/b,最后一块记录数小于等于s;

每一块中的关键字不一定有序,但前一块中的最大关键字必须小于后一块中的最小关键字。

注:这是使用分块查找的前提条件。

如上将表均匀分成b块后,抽取各块中的最大关键字和起始位置构成一个索引表IDX[0...b-1]。

由于表R是分块有序的,所以索引表是一个递增有序表。

下图就是一个分块查找表的存储结构示意图

分块查找算法有两个处理步骤:

(1) 首先查找索引表

因为分块查找表是“分块有序”的,所以我们可以通过索引表来锁定关键字所在的区间。

又因为索引表是递增有序的,所以查找索引可以使用顺序查找或二分查找。

(2) 然后在已确定的块中进行顺序查找

因为块中不一定是有序的,所以只能使用顺序查找。

代码范例

 分块查找之JAVA实现

运行结果

线性表: 8 14 6 9 10 22 34 18 19 31 40 38 54 66 46 71 78 68 80 85 

构造索引表如下:

key = 14, link = 0

key = 34, link = 5

key = 66, link = 10

key = 85, link = 15

查找key = 85成功,位置为19

因为分块查找实际上是两次查找过程之和。若以二分查找来确定块,显然它的查找效率介于顺序查找和二分查找之间。

(1) 以平均查找长度而言,二分查找 &gt; 分块查找 &gt; 顺序查找。

(2) 从适用性而言,顺序查找无限制条件,二分查找仅适用于有序表,分块查找要求“分块有序”。

(3) 从存储结构而言,顺序查找和分块查找既可用于顺序表也可用于链表;而二分查找只适用于顺序表。

(4) 分块查找综合了顺序查找和二分查找的优点,既可以较为快速,也能使用动态变化的要求。

 本文转自静默虚空博客园博客,原文链接:http://www.cnblogs.com/jingmoxukong/p/4324179.html,如需转载请自行联系原作者

继续阅读