MySQL的btree索引和hash索引的差別(轉載)

Hash 索引結構的特殊性，其檢索效率非常高，索引的檢索可以一次定位，不像B-Tree 索引需要從根節點到枝節點，最後才能通路到頁節點這樣多次的IO通路，是以 Hash 索引的查詢效率要遠高于 B-Tree 索引。

可能很多人又有疑問了，既然 Hash 索引的效率要比 B-Tree 高很多，為什麼大家不都用 Hash 索引而還要使用 B-Tree 索引呢？任何事物都是有兩面性的，Hash 索引也一樣，雖然 Hash 索引效率高，但是 Hash 索引本身由于其特殊性也帶來了很多限制和弊端，主要有以下這些。

（1）Hash 索引僅僅能滿足"=","IN"和"<=>"查詢，不能使用範圍查詢。

由于 Hash 索引比較的是進行 Hash 運算之後的 Hash 值，是以它隻能用于等值的過濾，不能用于基于範圍的過濾，因為經過相應的 Hash 算法處理之後的 Hash 值的大小關系，并不能保證和Hash運算前完全一樣。

（2）Hash 索引無法被用來避免資料的排序操作。

由于 Hash 索引中存放的是經過 Hash 計算之後的 Hash 值，而且Hash值的大小關系并不一定和 Hash 運算前的鍵值完全一樣，是以資料庫無法利用索引的資料來避免任何排序運算；

（3）Hash 索引不能利用部分索引鍵查詢。

對于組合索引，Hash 索引在計算 Hash 值的時候是組合索引鍵合并後再一起計算 Hash 值，而不是單獨計算 Hash 值，是以通過組合索引的前面一個或幾個索引鍵進行查詢的時候，Hash 索引也無法被利用。

（4）Hash 索引在任何時候都不能避免表掃描。

前面已經知道，Hash 索引是将索引鍵通過 Hash 運算之後，将 Hash運算結果的 Hash 值和所對應的行指針資訊存放于一個 Hash 表中，由于不同索引鍵存在相同 Hash 值，是以即使取滿足某個 Hash 鍵值的資料的記錄條數，也無法從 Hash 索引中直接完成查詢，還是要通過通路表中的實際資料進行相應的比較，并得到相應的結果。

（5）Hash 索引遇到大量Hash值相等的情況後性能并不一定就會比B-Tree索引高。

對于選擇性比較低的索引鍵，如果建立 Hash 索引，那麼将會存在大量記錄指針資訊存于同一個 Hash 值相關聯。這樣要定位某一條記錄時就會非常麻煩，會浪費多次表資料的通路，而造成整體性能低下

2. B-Tree索引

B-Tree 索引是 MySQL 資料庫中使用最為頻繁的索引類型，除了 Archive 存儲引擎之外的其他所有的存儲引擎都支援 B-Tree 索引。不僅僅在 MySQL 中是如此，實際上在其他的很多資料庫管理系統中B-Tree 索引也同樣是作為最主要的索引類型，這主要是因為 B-Tree 索引的存儲結構在資料庫的資料檢索中有非常優異的表現。

一般來說， MySQL 中的 B-Tree 索引的實體檔案大多都是以 Balance Tree 的結構來存儲的，也就是所有實際需要的資料都存放于 Tree 的 Leaf Node ，而且到任何一個 Leaf Node 的最短路徑的長度都是完全相同的，是以我們大家都稱之為 B-Tree 索引當然，可能各種資料庫（或 MySQL 的各種存儲引擎）在存放自己的 B-Tree 索引的時候會對存儲結構稍作改造。如 Innodb 存儲引擎的 B-Tree 索引實際使用的存儲結構實際上是 B+Tree ，也就是在 B-Tree 資料結構的基礎上做了很小的改造，在每一個

Leaf Node 上面出了存放索引鍵的相關資訊之外，還存儲了指向與該 Leaf Node 相鄰的後一個 LeafNode 的指針資訊，這主要是為了加快檢索多個相鄰 Leaf Node 的效率考慮。

在 Innodb 存儲引擎中，存在兩種不同形式的索引，一種是 Cluster 形式的主鍵索引（ Primary Key ），另外一種則是和其他存儲引擎（如 MyISAM 存儲引擎）存放形式基本相同的普通 B-Tree 索引，這種索引在 Innodb 存儲引擎中被稱為 Secondary Index 。下面我們通過圖示來針對這兩種索引的存放

形式做一個比較。

MySQL的btree索引和hash索引的差別(轉載)

圖示中左邊為 Clustered 形式存放的 Primary Key ，右側則為普通的 B-Tree 索引。兩種 Root Node 和 Branch Nodes 方面都還是完全一樣的。而 Leaf Nodes 就出現差異了。在 Prim中， Leaf Nodes 存放的是表的實際資料，不僅僅包括主鍵字段的資料，還包括其他字段的資料據以主鍵值有序的排列。而 Secondary Index 則和其他普通的 B-Tree 索引沒有太大的差異，Leaf Nodes 出了存放索引鍵的相關資訊外，還存放了 Innodb 的主鍵值。

是以，在 Innodb 中如果通過主鍵來通路資料效率是非常高的，而如果是通過 Secondary Index 來通路資料的話， Innodb 首先通過 Secondary Index 的相關資訊，通過相應的索引鍵檢索到 Leaf Node之後，需要再通過 Leaf Node 中存放的主鍵值再通過主鍵索引來擷取相應的資料行。MyISAM 存儲引擎的主鍵索引和非主鍵索引差别很小，隻不過是主鍵索引的索引鍵是一個唯一且非空的鍵而已。而且 MyISAM 存儲引擎的索引和 Innodb 的 Secondary Index 的存儲結構也基本相同，主要的差別隻是 MyISAM 存儲引擎在 Leaf Nodes 上面出了存放索引鍵資訊之外，再存放能直接定位到 MyISAM 資料檔案中相應的資料行的資訊（如 Row Number ），但并不會存放主鍵的鍵值資訊

MySQL的btree索引和hash索引的差別(轉載)

繼續閱讀

Testlink安裝部署之XAMPP

set define off關閉替代變量功能

報錯：'mysql' 不是内部或外部指令，也不是可運作的程式或批處理檔案。

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

neo4j之cypher使用文檔

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

登入plsql 報錯 the account is locked --使用者被鎖

SequoiaDB巨杉資料庫C++驅動概述