需要從資料庫檢索某些符合要求的資料,我們很容易寫出 Select A B C FROM T WHERE ID = XX 這樣的SQL,那麼當我們向資料庫發送這樣一個請求時,資料庫到底做了什麼?
我們今天以MYSQL為例,揭示一下MySQL資料庫的查詢過程,并讓大家對資料庫裡的一些零件有所了解。
MYSQL架構

MySQL 主要可以分為 Server 層和存儲引擎層。
Server層 包括連接配接器、查詢緩存、分析器、優化器、執行器等,所有跨存儲引擎的功能都在這一層實作,比如存儲過程、觸發器、視圖、函數等,還有個通用的日志子產品binlog日志子產品;
存儲引擎層 負責資料的存儲和提取。其架構模式是插件式的,支援 InnoDB、MyISAM、Memory 等多個存儲引擎。現在最常用的存儲引擎是 InnoDB(支援事務),它從 MySQL5.5.5 版本開始成為預設存儲引擎。
連接配接器
連接配接器主要負責使用者登入資料庫,進行使用者的身份認證,包括校驗賬戶密碼,權限等操作。
如果使用者密碼不對,你就會收到一個"Access denied for user"的錯誤,然後用戶端程式結束執行。
如果使用者賬戶密碼已認證,連接配接器會到權限表中查詢該使用者的所有權限,之後在這個連接配接裡的權限邏輯判斷都是會依賴此時讀取到的權限資料,也就是說,後續隻要這個連接配接不斷開,即時管理者修改了該使用者的權限,該使用者也是不受影響的。
查詢緩存( Query cache)
用戶端與服務端建立連接配接後,MySQL 在執行查詢語句時會先查詢緩存,校驗這條SQL是不是在之前執行過。之前執行過的語句及其結果會以 key-value 對的形式,被直接緩存在記憶體中。key 是查詢的語句,value 是查詢的結果。如果你的查詢能夠直接在這個緩存中找到 key,那麼這個value 就會被直接傳回給用戶端。如果沒有命中,則需要執行後續的操作,完成後也會把結果緩存起來,友善下一次調用。
看到這裡大家會不會眼前一亮,會不會有這個功能很好要好好利用的沖動。
其實這裡并不建議使用查詢緩存,查詢緩存的失效非常頻繁,隻要有對一個表的更新,這個表上所有的查詢緩存都會被清空。是以很可能你費勁地把結果存起來,還沒使用就被一個更新全清空了。對于更新壓力大的資料庫來說,查詢緩存的命中率會非常低。除非是那種很長時間不會更新的表,比如系統配置表,但是這種系統配置我們放在配置平台不好嗎?
在MYSQL8.0中已經删除了查詢緩存這個功能,官方也是認為該功能在實際的應用場景比較少,是以幹脆直接删掉了。
分析器
Mysql沒有命中查詢緩存,那麼就會進入分析器,分析器主要是用來分析SQL語句是來幹嘛的。分析器主要分為以下兩步:
- 詞法分析 :一條SQL語句有多個字元串組成,首先要提取關鍵字,比如select,提出查詢的表,提出字段名,提出查詢條件等等。
- 文法分析:根據詞法分析的結果,文法分析主要就是判斷你輸入的SQL語句是否正确,是否符合MYSQL文法,如果你的語句不對,就會收到“You have an error in your SQL syntax”的錯誤提醒。
詞法分析程式将整個查詢語句分解成各類标志,文法分析根據定義的系統語言将“各類标志”轉為對MySQL有意義的組合。最後系統生成一個文法樹(AST),文法樹便是優化器依賴的資料結構。
優化器
經過了分析器,MySQL 就知道你要做什麼了。在開始執行之前,還要先經過優化器的處理。
為什麼需要優化器?
- 優化器中包含了許多複雜的優化技術,這些優化技術往往比最好的程式員掌握的還要多。系統的自動優化相當于使得所有人都擁有這些優化技術。
- 優化器可以從資料字典中擷取許多統計資訊,例如表中的行數、表中的每個列的分布情況等。優化器優化器可以考慮百種不同的執行計劃,而程式員一般隻能考慮有限的幾種可能;
- 可以根據這些資訊選擇有效的執行計劃,而使用者程式則難以獲得這些資訊;
總之優化器是對文法分析樹的形态進行修改,把文法分析樹變為查詢樹,确定執行方案。
執行器
MySQL 通過分析器知道了你要做什麼,通過優化器知道了該怎麼做,于是就進入了執行器階段,開始執行語句。
開始執行的時候,要先校驗改使用者是否有執行查詢的權限,如果沒有,就會傳回沒有權限的錯誤。如果有權限,就會去調用引擎的接口,傳回接口執行的結果。
語句分析
我們以下面一條真實SQL查詢語句來進行分析下MYSQL查詢的執行過程
select id,name,sex,phoone from user t where t.age='26' and t.account='javadaily'
- 首先用戶端需要連接配接上資料庫,如果賬号密碼錯誤直接傳回錯誤資訊,如果正确則進入下一步。
- 在MYSQL8.0之前會先去查詢緩存中,以這條SQL語句作為key在記憶體中查詢是否有結果,如果有則先判斷是否有權限,有權限則傳回用戶端,否則報錯;如果沒有從查詢緩存命中則進入下一步
- 通過分析器進行詞法分析,提取sql語句的關鍵元素,比如提取上面這個語句是查詢select,提取需要查詢的表名為
,需要查詢的列為user
,查詢條件是id,name,sex,phoone
和age=26
。然後判斷這個sql語句是否有文法錯誤,比如關鍵詞是否正确等等,如果檢查沒問題就執行下一步。account=javadailly
- 上面的SQL有兩種執行方案,優化器根據自己的優化算法選擇執行效率最高的a方案(統計資訊不準可能導緻優化器選擇錯誤的執行方案),确定了優化方案後就開始執行。
a. 先查詢的使用者,然後判斷
account=javadaily
age
是否等于26
b. 先找出
的使用者,再查詢
age=26
的使用者
account=javadaily
- 進行權限校驗,如果有查詢權限則調用資料庫引擎接口傳回執行結果;否則報錯。