天天看點

B+樹索引和哈希索引的差別

https://www.cnblogs.com/heiming/p/5865101.html

下面是MySQL中建表時建立索引

CREATE TABLE t(
aid int unsigned not null auto_increment,
userid int unsigned not null default 0,
username varchar(20) not null default ‘’,
detail varchar(255) not null default ‘’,
primary key(aid),
unique key(uid) USING BTREE,
key (username(12)) USING BTREE — 此處 uname 列隻建立了最左12個字元長度的部分索引
)engine=InnoDB;
           

簡單地說,哈希索引就是采用一定的雜湊演算法,把鍵值換算成新的哈希值,檢索時不需要類似B+樹那樣從根節點到葉子節點逐級查找,隻需一次雜湊演算法即可立刻定位到相應的位置,速度非常快。

B+樹索引和哈希索引的明顯差別是:

如果是等值查詢,那麼哈希索引明顯有絕對優勢,因為隻需要經過一次算法即可找到相應的鍵值;當然了,這個前提是,鍵值都是唯一的。如果鍵值不是唯一的,就需要先找到該鍵所在位置,然後再根據連結清單往後掃描,直到找到相應的資料;

如果是範圍查詢檢索,這時候哈希索引就毫無用武之地了,因為原先是有序的鍵值,經過雜湊演算法後,有可能變成不連續的了,就沒辦法再利用索引完成範圍查詢檢索;

同理,哈希索引也沒辦法利用索引完成排序,以及like ‘xxx%’ 這樣的部分模糊查詢(這種部分模糊查詢,其實本質上也是範圍查詢);

哈希索引也不支援多列聯合索引的最左比對規則;

B+樹索引的關鍵字檢索效率比較平均,不像B樹那樣波動幅度大,在有大量重複鍵值情況下,哈希索引的效率也是極低的,因為存在所謂的哈希碰撞問題。

通常,B+樹索引結構适用于絕大多數場景,像下面這種場景用哈希索引才更有優勢:

SELECT … FROM t WHERE C1 = ?; — 僅等值查詢
           

在大多數場景下,都會有範圍查詢、排序、分組等查詢特征,用B+樹索引就可以了。