天天看點

MySQL資料庫引擎詳解

作為Java程式員,MySQL資料庫大家平時應該都沒少使用吧,對MySQL資料庫的引擎應該也有所了解,這篇文章就讓我詳細的說說MySQL資料庫的Innodb和MyIASM兩種引擎以及其索引結構。也來鞏固一下自己對這塊知識的掌握。

Innodb引擎

Innodb引擎提供了對資料庫ACID事務的支援,并且實作了SQL标準的四種隔離級别,關于資料庫事務與其隔離級别的内容請見資料庫事務與其隔離級别這篇文章。該引擎還提供了行級鎖和外鍵限制,它的設計目标是處理大容量資料庫系統,它本身其實就是基于MySQL背景的完整資料庫系統,MySQL運作時Innodb會在記憶體中建立緩沖池,用于緩沖資料和索引。但是該引擎不支援FULLTEXT類型的索引,而且它沒有儲存表的行數,當

SELECT COUNT(*) FROM TABLE

時需要掃描全表。當需要使用資料庫事務時,該引擎當然是首選。由于鎖的粒度更小,寫操作不會鎖定全表,是以在并發較高時,使用Innodb引擎會提升效率。但是使用行級鎖也不是絕對的,如果在執行一個SQL語句時MySQL不能确定要掃描的範圍,InnoDB表同樣會鎖全表。

MyIASM引擎

MyIASM是MySQL預設的引擎,但是它沒有提供對資料庫事務的支援,也不支援行級鎖和外鍵,是以當INSERT(插入)或UPDATE(更新)資料時即寫操作需要鎖定整個表,效率便會低一些。不過和Innodb不同,MyIASM中存儲了表的行數,于是

SELECT COUNT(*) FROM TABLE

時隻需要直接讀取已經儲存好的值而不需要進行全表掃描。如果表的讀操作遠遠多于寫操作且不需要資料庫事務的支援,那麼MyIASM也是很好的選擇。

兩種引擎的選擇

大尺寸的資料集趨向于選擇InnoDB引擎,因為它支援事務處理和故障恢複。資料庫的大小決定了故障恢複的時間長短,InnoDB可以利用事務日志進行資料恢複,這會比較快。主鍵查詢在InnoDB引擎下也會相當快,不過需要注意的是如果主鍵太長也會導緻性能問題,關于這個問題我會在下文中講到。大批的

INSERT

語句(在每個

INSERT

語句中寫入多行,批量插入)在MyISAM下會快一些,但是

UPDATE

語句在InnoDB下則會更快一些,尤其是在并發量大的時候。

Index——索引

索引(Index)是幫助MySQL高效擷取資料的資料結構。MyIASM和Innodb都使用了樹這種資料結構做為索引,關于樹我也曾經寫過一篇文章樹是一種偉大的資料結構,隻是自己的了解,有興趣的朋友可以去閱讀。下面我接着講這兩種引擎使用的索引結構,講到這裡,首先應該談一下B-Tree和B+Tree。

B-Tree和B+Tree

B+Tree是B-Tree的變種,那麼我就先講B-Tree吧,相信大家都知道紅黑樹,這是我前段時間學《算法》一書時,實作的一顆紅黑樹,大家可以參考。其實紅黑樹類似2,3-查找樹,這種樹既有2叉結點又有3叉結點。B-Tree也與之類似,它的每個結點做多可以有d個分支(叉),d稱為B-Tree的度,如下圖所示,它的每個結點可以有4個元素,5個分支,于是它的度為5。B-Tree中的元素是有序的,比如圖中元素7左邊的指針指向的結點中的元素都小于7,而元素7和16之間的指針指向的結點中的元素都處于7和16之間,正是滿足這樣的關系,才能高效的查找:首先從根節點進行二分查找,找到就傳回對應的值,否則就進入相應的區間結點遞歸的查找,直到找到對應的元素或找到null指針,找到null指針則表示查找失敗。這個查找是十分高效的,其時間複雜度為O(logN)(以d為底,當d很大時,樹的高度就很低),因為每次檢索最多隻需要檢索樹高h個結點。

MySQL資料庫引擎詳解

接下來就該講B+Tree了,它是B-Tree的變種,如下面兩張圖所示:

MySQL資料庫引擎詳解
MySQL資料庫引擎詳解

從圖中就可以看出,B+Tree的内部結點不存儲資料,隻存儲指針,而葉子結點則隻存儲資料,不存儲指針。并且在其每個葉子節點上增加了一個指向相鄰葉子節點的指針,這個優化提高區間通路的性能,比如在第二張圖中要查詢鍵為從18到49的所有資料,當找到18後,隻需順着節點和指針順序周遊就可以一次性通路到所有資料節點,極大提到了區間查詢效率。

MyISAM引擎的索引結構

MyISAM引擎的索引結構為B+Tree,其中B+Tree的資料域存儲的内容為實際資料的位址,也就是說它的索引和實際的資料是分開的,隻不過是用索引指向了實際的資料,這種索引就是所謂的非聚集索引。

Innodb引擎的索引結構

MyISAM引擎的索引結構同樣也是B+Tree,但是Innodb的索引檔案本身就是資料檔案,即B+Tree的資料域存儲的就是實際的資料,這種索引就是聚集索引。這個索引的key就是資料表的主鍵,是以InnoDB表資料檔案本身就是主索引。

因為InnoDB的資料檔案本身要按主鍵聚集,是以InnoDB要求表必須有主鍵(MyISAM可以沒有),如果沒有顯式指定,則MySQL系統會自動選擇一個可以唯一辨別資料記錄的列作為主鍵,如果不存在這種列,則MySQL自動為InnoDB表生成一個隐含字段作為主鍵,這個字段長度為6個位元組,類型為長整形。

并且和MyISAM不同,InnoDB的輔助索引資料域存儲的也是相應記錄主鍵的值而不是位址,是以當以輔助索引查找時,會先根據輔助索引找到主鍵,再根據主鍵索引找到實際的資料。是以Innodb不建議使用過長的主鍵,否則會使輔助索引變得過大。建議使用自增的字段作為主鍵,這樣B+Tree的每一個結點都會被順序的填滿,而不會頻繁的分裂調整,會有效的提升插入資料的效率。