mysql hash索引和b-tree索引的差別究竟在哪裡呢?相信很多人都有這樣的疑問,下文對兩者的差別進行了詳細的分析,供您參考。
mysql hash索引結構的特殊性,其檢索效率非常高,索引的檢索可以一次定位,不像b-tree 索引需要從根節點到枝節點,最後才能通路到頁節點這樣多次的io通路,是以 hash 索引的查詢效率要遠高于 b-tree 索引。
可 能很多人又有疑問了,既然 hash 索引的效率要比 b-tree 高很多,為什麼大家不都用 hash 索引而還要使用 b-tree 索引呢?任何事物都是有兩面性的,hash 索引也一樣,雖然 hash 索引效率高,但是 hash 索引本身由于其特殊性也帶來了很多限制和弊端,主要有以下這些。
(1)mysql hash索引僅僅能滿足"=","in"和"<=>"查詢,不能使用範圍查詢。
由于 mysql hash索引比較的是進行 hash 運算之後的 hash 值,是以它隻能用于等值的過濾,不能用于基于範圍的過濾,因為經過相應的 hash 算法處理之後的 hash 值的大小關系,并不能保證和hash運算前完全一樣。
(2)mysql hash索引無法被用來避免資料的排序操作。
由于 mysql hash索引中存放的是經過 hash 計算之後的 hash 值,而且hash值的大小關系并不一定和 hash 運算前的鍵值完全一樣,是以資料庫無法利用索引的資料來避免任何排序運算;
(3)mysql hash索引不能利用部分索引鍵查詢。
對于組合索引,hash 索引在計算 hash 值的時候是組合索引鍵合并後再一起計算 hash 值,而不是單獨計算 hash 值,是以通過組合索引的前面一個或幾個索引鍵進行查詢的時候,hash 索引也無法被利用。
(4)mysql hash索引在任何時候都不能避免表掃描。
前面已經知道,hash 索引是将索引鍵通過 hash 運算之後,将 hash運算結果的 hash 值和所對應的行指針資訊存放于一個 hash 表中,由于不同索引鍵存在相同 hash 值,是以即使取滿足某個 hash 鍵值的資料的記錄條數,也無法從 hash 索引中直接完成查詢,還是要通過通路表中的實際資料進行相應的比較,并得到相應的結果。
(5)mysql hash索引遇到大量hash值相等的情況後性能并不一定就會比b-tree索引高。
對于選擇性比較低的索引鍵,如果建立 hash 索引,那麼将會存在大量記錄指針資訊存于同一個 hash 值相關聯。這樣要定位某一條記錄時就會非常麻煩,會浪費多次表資料的通路,而造成整體性能低下。