<b>存儲引擎是什麼?</b>
MySQL中的資料用各種不同的技術存儲在檔案(或者記憶體)中。這些技術中的每一種技術都使用不同的存儲機制、索引技巧、鎖定水準并且最終提供廣泛的不同的功能和能力。通過選擇不同的技術,你能夠獲得額外的速度或者功能,進而改善你的應用的整體功能。
例如,如果你在研究大量的臨時資料,你也許需要使用記憶體存儲引擎。記憶體存儲引擎能夠在記憶體中存儲所有的表格資料。又或者,你也許需要一個支援事務處理的資料庫(以確定事務處理不成功時資料的回退能力)。
這些不同的技術以及配套的相關功能在MySQL中被稱作存儲引擎(也稱作表類型)。MySQL預設配置了許多不同的存儲引擎,可以預先設定或者在MySQL伺服器中啟用。你可以選擇适用于伺服器、資料庫和表格的存儲引擎,以便在選擇如何存儲你的資訊、如何檢索這些資訊以及你需要你的資料結合什麼性能和功能的時候為你提供最大的靈活性。
選擇如何存儲和檢索你的資料的這種靈活性是MySQL為什麼如此受歡迎的主要原因。其它資料庫系統(包括大多數商業選擇)僅支援一種類型的資料存儲。遺憾的是,其它類型的資料庫解決方案采取的“一個尺碼滿足一切需求”的方式意味着你要麼就犧牲一些性能,要麼你就用幾個小時甚至幾天的時間詳細調整你的資料庫。使用MySQL,我們僅需要修改我們使用的存儲引擎就可以了。
在這篇文章中,我們不準備集中讨論不同的存儲引擎的技術方面的問題(盡管我們不可避免地要研究這些因素的某些方面),相反,我們将集中介紹這些不同的引擎分别最适應哪種需求和如何啟用不同的存儲引擎。為了實作這個目的,在介紹每一個存儲引擎的具體情況之前,我們必須要了解一些基本的問題。
<b>如何确定有哪些存儲引擎可用</b>
你可以在MySQL(假設是MySQL伺服器4.1.2以上版本)中使用顯示引擎的指令得到一個可用引擎的清單。
16 rows in set (0.01 sec) 這個表格顯示了可用的資料庫引擎的全部名單以及在目前的資料庫伺服器中是否支援這些引擎。
對于MySQL 4.1.2以前版本,可以使用mysql> show variables like "have_%"(顯示類似“have_%”的變量):
你可以通過修改設定腳本中的選項來設定在MySQL安裝軟體中可用的引擎。如果你在使用一個預先包裝好的MySQL二進制釋出版軟體,那麼,這個軟體就包含了常用的引擎。然而,需要指出的是,如果你要使用某些不常用的引擎,特别是CSV、RCHIVE(存檔)和BLACKHOLE(黑洞)引擎,你就需要手工重新編譯MySQL源碼 。
<b>使用一個指定的存儲引擎</b>
你可以使用很多方法指定一個要使用的存儲引擎。最簡單的方法是,如果你喜歡一種能滿足你的大多數資料庫需求的存儲引擎,你可以在MySQL 設定檔案中設定一個預設的引擎類型(使用storage_engine 選項)或者在啟動資料庫伺服器時在指令行後面加上--default-storage-engine或--default-table-type選項。
更靈活的方式是在随MySQL伺服器釋出同時提供的MySQL用戶端時指定使用的存儲引擎。最直接的方式是在建立表時指定存儲引擎的類型,向下面這樣:
你還可以改變現有的表使用的存儲引擎,用以下語句:
然而,你在以這種方式修改表格類型的時候需要非常仔細,因為對不支援同樣的索引、字段類型或者表大小的一個類型進行修改可能使你丢失資料。如果你指定一個在你的目前的資料庫中不存在的一個存儲引擎,那麼就會建立一個MyISAM(預設的)類型的表。
<b>各存儲引擎之間的差別</b>
為了做出選擇哪一個存儲引擎的決定,我們首先需要考慮每一個存儲引擎提供了哪些不同的核心功能。這種功能使我們能夠把不同的存儲引擎差別開來。我們一般把這些核心功能分為四類:支援的字段和資料類型、鎖定類型、索引和處理。一些引擎具有能過促使你做出決定的獨特的功能,我們一會兒再仔細研究這些具體問題。
<b>字段和資料類型</b>
雖然所有這些引擎都支援通用的資料類型,例如整型、實型和字元型等,但是,并不是所有的引擎都支援其它的字段類型,特别是BLOG(二進制大對象)或者TEXT文本類型。其它引擎也許僅支援有限的字元寬度和資料大小。
這些局限性可能直接影響到你可以存儲的資料,同時也可能會對你實施的搜尋的類型或者你對那些資訊建立的索引産生間接的影響。這些差別能夠影響你的應用程式的性能和功能,因為你必須要根據你要存儲的資料類型選擇對需要的存儲引擎的功能做出決策。
<b>鎖定</b>
資料庫引擎中的鎖定功能決定了如何管理資訊的通路和更新。當資料庫中的一個對象為資訊更新鎖定了,在更新完成之前,其它處理不能修改這個資料(在某些情況下還不允許讀這種資料)。
鎖定不僅影響許多不同的應用程式如何更新資料庫中的資訊,而且還影響對那個資料的查詢。這是因為查詢可能要通路正在被修改或者更新的資料。總的來說,這種延遲是很小的。大多數鎖定機制主要是為了防止多個處理更新同一個資料。由于向資料中插入資訊和更新資訊這兩種情況都需要鎖定,你可以想象,多個應用程式使用同一個資料庫可能會有很大的影響。
不同的存儲引擎在不同的對象級别支援鎖定,而且這些級别将影響可以同時通路的資訊。得到支援的級别有三種:表鎖定、塊鎖定和行鎖定。支援最多的是表鎖定,這種鎖定是在MyISAM中提供的。在資料更新時,它鎖定了整個表。這就防止了許多應用程式同時更新一個具體的表。這對應用很多的多使用者資料庫有很大的影響,因為它延遲了更新的過程。
頁級鎖定使用Berkeley DB引擎,并且根據上載的資訊頁(8KB)鎖定資料。當在資料庫的很多地方進行更新的時候,這種鎖定不會出現什麼問題。但是,由于增加幾行資訊就要鎖定資料結構的最後8KB,當需要增加大量的行,也别是大量的小型資料,就會帶來問題。
行級鎖定提供了最佳的并行通路功能,一個表中隻有一行資料被鎖定。這就意味着很多應用程式能夠更新同一個表中的不同行的資料,而不會引起鎖定的問題。隻有InnoDB存儲引擎支援行級鎖定。
<b>建立索引</b>
建立索引在搜尋和恢複資料庫中的資料的時候能夠顯著提高性能。不同的存儲引擎提供不同的制作索引的技術。有些技術也許會更适合你存儲的資料類型。
有些存儲引擎根本就不支援索引,其原因可能是它們使用基本表索引(如MERGE引擎)或者是因為資料存儲的方式不允許索引(例如FEDERATED或者BLACKHOLE引擎)。
<b>事務處理</b>
事務處理功能通過提供在向表中更新和插入資訊期間的可靠性。這種可靠性是通過如下方法實作的,它允許你更新表中的資料,但僅當應用的應用程式的所有相關操作完全完成後才接受你對表的更改。例如,在會計進行中每一筆會計分錄處理将包括對借方科目和貸方科目資料的更改,你需要要使用事務處理功能保證對借方科目和貸方科目的資料更改都順利完成,才接受所做的修改。如果任一項操作失敗了,你都可以取消這個事務處理,這些修改就不存在了。如果這個事務處理過程完成了,我們可以通過允許這個修改來确認這個操作。
本文轉自holy2009 51CTO部落格,原文連結:http://blog.51cto.com/holy2010/370161