靜态查找表：順序查找、折半查找、分塊查找

引言：

除去各種線性和非線性的資料結構外，還有一種在實際應用中大量使用的資料結構——查找表。查找表是由同一類型的資料元素構成的集合。

對查找表經常進行的操作有：1、查找某個"特定的"資料元素是否在查找表中；2、檢索某個"特定的"資料元素的各種屬性；3、在查找表中插入一個資料元素；4、從查找表中删去某個資料元素。對查找表隻作前兩種統稱為"查找"的操作，則稱此類查找表為靜态查找表。若在查找過程中同時插入查找表中不存在的資料元素，或者從查找表中删除已存在的某個資料元素，則稱此類表為動态查找表。

基礎知識：

[cpp] view plain copy print ?

關鍵字類型和資料元素類型統一說明如下：
典型的關鍵字類型說明可以是：
typedef float KeyType; //實型
typedef int KeyType; //整型
typedef char KeyType; //字元串型
資料元素類型定義為：
typedef struct {
KeyType key; //關鍵字域
........ //其他域
}SElmType;
對兩個關鍵字的比較約定如下的宏定義：
//對數值型關鍵字
#define EQ(a, b) ((a) == (b))
#define LT(a, b) ((a) < (b))
#define LQ(a, b) ((a) > (b))
//對字元串型關鍵字
#define EQ(a, b) (!strcmp((a), (b)))
#define LT(a, b) (strcmp((a), (b)) < 0)
#define LQ(a, b) (strcmp((a), (b)) > 0)

具體分析：

1、順序查找。

順序查找：從表中最後一個記錄開始，逐個進行記錄的關鍵字和給定值的比較，若某個記錄的關鍵字和給定值比較相等，則查找成功，找到所查記錄；反之，若直至第一個記錄，其關鍵字和給定值比較都不相等，則表明表中沒有所查記錄，查找不成功。

性能分析：我們知道當讨論一個程式的性能時一般從3個角度：時間複雜度、空間複雜度、和算法的其他性能。由于在查找過程中，通常隻是需要一個固定大小的輔助空間來做比較，是以空間複雜度是一定的。而時間複雜度卻是可變的：其關鍵字和給定值進行過比較的記錄個數的平均值。

适用範圍：順序查找一般适用于查找資料比較少的情況下。

優點：

1、算法實作簡單且适應面廣

2、對表的結構無任何要求，無論記錄是否按關鍵字有序排列。

3、即适用于順序表又适用于單連結清單。

缺點：

1、平均查找長度較大，特别是當n很大時，查找效率較低。

2、速度慢，平均查找長度為 (n + 1) / 2，時間複雜度為 O(n)

[cpp] view plain copy print ?

typedef int ElementType;
#define EQ(a, b) ((a) == (b))
int sequential(int Array[], ElementType key, int n)
{
int index;
for(index = 0; index < n; index++){
if(EQ(Array[index], key))
return index + 1;
}
return -1;
}

2、折半查找。

折半查找：折半查找又稱二分查找，先确定待查記錄所在的範圍（區間），然後逐漸縮小範圍直到找到或找不到該記錄為止。

适用範圍：對于規模較大的有序表查找，效率較高。适合很少改動但經常查找的表。

優點：

1、折半查找的效率比順序查找要高。

2、折半查找的時間複雜度為log2(n)

3、折半查找的平均查找長度為log2(n+1) - 1

缺點：

1、折半查找隻适用于有序表

2、折半查找限于順序存儲結構，對線性連結清單無法有效地進行折半查找

關鍵字key與表中某一進制素array[i]比較，有3中情況：

1. key == array[i]，查找成功

2.key > array[i], 待查找元素可能的範圍是array[i]之前

3.key < array[i], 待查找元素可能的範圍是array[i]之後

[cpp] view plain copy print ?

typedef int ElementType;
#define EQ(a, b) ((a) == (b))
#define LT(a, b) ((a) < (b))
#define LQ(a, b) ((a) <= (b))
int Search_Bin(ElementType Array[], int num, int length)
{
int index_low, index_mid, index_high;
index_low = 1;
index_high = length;
while(index_low <= index_high){
index_mid = (index_low + index_high) / 2;
if(EQ(num, Array[index_mid]))
return index_mid + 1;
else if (LT(num, Array[index_mid]))
index_high = index_mid - 1;
else
index_low = index_mid + 1;
}
return -1;
}

3、分塊查找。

分塊查找：分塊查找又稱索引順序查找，它是順序查找的一種改進方法。将n個資料元素“按塊有序”劃分為m塊（m<=n）。每一塊中的資料元素不必有序，但塊與塊之間必須“按塊有序”，即第1快中的任一進制素的關鍵字都必須小于第2塊中任一進制素的關鍵字；而第2塊中任一進制素又都小于第3塊中的任一進制素，……

操作步驟：

1、先選取各快中的最大關鍵字構成一個索引表

2、查找分兩部分：先對索引表進行二分查找或順序查找，以确定待查記錄在哪一塊中；然後在已确定的快中用順序法進行查找。

優點：在表中插入或删除一個記錄時，隻要找到該記錄所在塊，就在該塊中進行插入或删除運算（因快内無序，是以不需要大量移動記錄）。

缺點：增加了一個輔助數組的存儲空間和将初始表分塊排序的運算。

性能：介于順序查找和二分查找之間。

[cpp] view plain copy print ?

#define MAX 3
#define MAXSIZE 18
typedef int ElemType;
typedef struct IndexItem{
ElemType index;
int start;
int length;
}IndexItem;
IndexItem indexlist[MAX];
ElemType MainList[MAXSIZE] = {22, 12, 13, 8, 9, 20, 33, 42, 44, 38, 24, 48, 60, 58, 74, 49, 86, 53};
int sequential(IndexItem indexlist[], ElemType key)
{
int index;
if(indexlist[0].index >= key) return 1;
for(index = 1; index <= MAX; index++){
if((indexlist[index-1].index < key)&&(indexlist[index].index >= key))
return index+1;
}
return 0;
}
int mainsequential(ElemType MainList[], int index, ElemType key)
{
int i, num=0;
for(i = 0; i < index-1; i++){
num += indexlist[i].length;
}
for(i = num; i < num+indexlist[index-1].length; i++){
if(MainList[i] == key) return i+1;
}
return -1;
}

除上面介紹的3種查找方法，還有針對有序表的斐波那契查找和插值查找以及靜态樹表的查找。

靜态查找表：順序查找、折半查找、分塊查找

繼續閱讀

GSL--GNU Scientific Library

D5|哈希表，善用資料結構

如何成為一名.net 工程師?

BMP檔案結構及圖像每行位元組計算方法

D. Ehab the Xorcist(構造+思維)

經典查找算法之二分查找

查找算法之二分查找查找算法之二分查找

JAVA高效程式設計指南

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

【資料結構】醫院選址

[轉]ISUP信令的IAM消息詳細内容

筆試面試題目：滑動視窗(二)

交通/城市相關的公開的資料集上學時整理的Xie et al., 2020收集的

資料結構與算法（27）——排序（二）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

Linux裝置模型（中）之上層容器