天天看點

美團面試官:說說你對MySQL中InnoDB的了解!前言InnoDB 體系架構1. 記憶體池2. 背景線程3. 存儲檔案InnoDB 邏輯存儲結構1. 表空間(Tablespace)2. 段 (Segment)3. 區 (Extent) / 頁(Page)4. 行(Row)InnoDB 事務之 redo log 工作原理LRU 淘汰政策總結

innodb 存儲引擎作為我們最常用到的存儲引擎之一,充分熟悉它的的實作和運作原理,有助于我們更好地建立和維護資料庫表,整理的一份mysql學習筆記希望能幫助到你們。

innodb 主要包括了:記憶體池、背景線程以及存儲檔案。

記憶體池又是由多個記憶體塊組成的,主要包括緩存磁盤資料、redo log 緩沖等;

背景線程則包括了 :master thread、io thread 以及 purge thread 等;

由 innodb 存儲引擎實作的表的存儲結構檔案一般包括表結構檔案(.frm)、共享表空間檔案(ibdata1)、獨占表空間檔案(ibd)以及日志檔案(redo 檔案等)等。

美團面試官:說說你對MySQL中InnoDB的了解!前言InnoDB 體系架構1. 記憶體池2. 背景線程3. 存儲檔案InnoDB 邏輯存儲結構1. 表空間(Tablespace)2. 段 (Segment)3. 區 (Extent) / 頁(Page)4. 行(Row)InnoDB 事務之 redo log 工作原理LRU 淘汰政策總結

我們知道,如果用戶端從資料庫中讀取資料是直接從磁盤讀取的話,無疑會帶來一定的性能瓶頸,緩沖池的作用就是提高整個資料庫的讀寫性能。

用戶端讀取資料時,如果資料存在于緩沖池中,用戶端就會直接讀取緩沖池中的資料,否則再去磁盤中讀取;對于資料庫中的修改資料,首先是修改在緩沖池中的資料,然後再通過 master thread 線程重新整理到磁盤上。

理論上來說,緩沖池的記憶體越大越好。緩沖池中不僅緩存索引頁和資料頁,還包括了 undo 頁,插入緩存、自适應哈希索引以及 innodb 地鎖資訊等等。

innodb 允許多個緩沖池執行個體,進而減少資料庫内部資源的競争,增強資料庫的并發處理能力,第 38 講還講到了緩沖池執行個體的配置以及調優。

innodb 存儲引擎會先将重做日志資訊放入到緩沖區中,然後再重新整理到重做日志檔案中。

master thread 主要負責将緩沖池中的資料異步重新整理到磁盤中,除此之外還包括插入緩存、undo 頁的回收等,io thread 是負責讀寫 io 的線程,而 purge thread 主要用于回收事務已經送出了的 undo log,pager cleaner thread 是新引入的一個用于協助 master thread 重新整理髒頁到磁盤的線程,它可以減輕 master thread 的工作壓力,減少阻塞。

在 mysql 中建立一張表都會生成一個.frm 檔案,該檔案是用來儲存每個表的中繼資料資訊的,主要包含表結構定義。

在 innodb 中,存儲資料都是按表空間進行存放的,預設為共享表空間,存儲的檔案即為共享表空間檔案(ibdata1)。若設定了參數 innodb_file_per_table 為 1,則會将存儲的資料、索引等資訊單獨存儲在一個獨占表空間,是以也會産生一個獨占表空間檔案(ibd)。如果你對共享表空間和獨占表空間的了解還不夠透徹,接下來我會詳解。

而日志檔案則主要是重做日志檔案,主要記錄事務産生的重做日志,保證事務的一緻性。

innodb 邏輯存儲結構分為表空間(tablespace)、段 (segment)、區 (extent)、頁 page) 以及行 (row)。

美團面試官:說說你對MySQL中InnoDB的了解!前言InnoDB 體系架構1. 記憶體池2. 背景線程3. 存儲檔案InnoDB 邏輯存儲結構1. 表空間(Tablespace)2. 段 (Segment)3. 區 (Extent) / 頁(Page)4. 行(Row)InnoDB 事務之 redo log 工作原理LRU 淘汰政策總結

innodb 提供了兩種表空間存儲資料的方式,一種是共享表空間,一種是獨占表空間。 innodb 預設會将其所有的表資料存儲在一個共享表空間中,即 ibdata1。

我們可以通過設定 innodb_file_per_table 參數為 1(1 代表獨占方式)開啟獨占表空間模式。開啟之後,每個表都有自己獨立的表空間實體檔案,所有的資料以及索引都會存儲在該檔案中,這樣友善備份以及恢複資料。

表空間是由各個段組成的,段一般分為資料段、索引段和復原段等。我們知道,innodb 預設是基于 b + 樹實作的資料存儲。

這裡的索引段則是指的 b + 樹的非葉子節點,而資料段則是 b + 樹的葉子節點。而復原段則指的是復原資料。

區是表空間的單元結構,每個區的大小為 1mb。而頁是組成區的最小單元,頁也是 innodb 存儲引擎磁盤管理的最小單元,每個頁的大小預設為 16kb。為了保證頁的連續性,innodb 存儲引擎每次從磁盤申請 4-5 個區。

innodb 存儲引擎是面向列的(row-oriented),也就是說資料是按行進行存放的,每個頁存放的行記錄也是有硬性定義的,最多允許存放 16kb/2-200 行,即 7992 行記錄。

innodb 是一個事務性的存儲引擎,而 innodb 的事務實作是基于事務日志 redo log 和 undo log 實作的。redo log 是重做日志,提供再寫入操作,實作事務的持久性;undo log 是復原日志,提供復原操作,保證事務的一緻性。

redo log 又包括了記憶體中的日志緩沖(redo log buffer)以及儲存在磁盤的重做日志檔案(redo log file),前者存儲在記憶體中,容易丢失,後者持久化在磁盤中,不會丢失。

innodb 的更新操作采用的是 write ahead log 政策,即先寫日志,再寫入磁盤。當一條記錄更新時,innodb 會先把記錄寫入到 redo log buffer 中,并更新記憶體資料。我們可以通過參數

innodb_flush_log_at_trx_commit 自定義 commit 時,如何将 redo log buffer 中的日志重新整理到 redo log file 中。

在這裡,我們需要注意的是 innodb 的 redo log 的大小是固定的,分别有多個日志檔案采用循環方式組成一個循環閉環,當寫到結尾時,會回到開頭循環寫日志。我們可以通過參數 innodb_log_files_in_group 和 innodb_log_file_size 配置日志檔案數量和每個日志檔案的大小。

buffer pool 中更新的資料未重新整理到磁盤中,該記憶體頁我們稱之為髒頁。最終髒頁的資料會重新整理到磁盤中,将磁盤中的資料覆寫,這個過程與 redo log 不一定有關系。

隻有當 redo log 日志滿了的情況下,才會主動觸發髒頁重新整理到磁盤,而髒頁不僅隻有 redo log 日志滿了的情況才會重新整理到磁盤,以下幾種情況同樣會觸發髒頁的重新整理:

系統記憶體不足時,需要将一部分資料頁淘汰掉,如果淘汰的是髒頁,需要先将髒頁同步到磁盤;

mysql 認為空閑的時間,這種情況沒有性能問題;

mysql 正常關閉之前,會把所有的髒頁刷入到磁盤,這種情況也沒有性能問題。

在生産環境中,如果我們開啟了慢 sql 監控,你會發現偶爾會出現一些用時稍長的 sql。這是因為髒頁在重新整理到磁盤時可能會給資料庫帶來性能開銷,導緻資料庫操作抖動。

美團面試官:說說你對MySQL中InnoDB的了解!前言InnoDB 體系架構1. 記憶體池2. 背景線程3. 存儲檔案InnoDB 邏輯存儲結構1. 表空間(Tablespace)2. 段 (Segment)3. 區 (Extent) / 頁(Page)4. 行(Row)InnoDB 事務之 redo log 工作原理LRU 淘汰政策總結

以上我們了解了 innodb 的更新和插入操作的具體實作原理,接下來我們再來了解下它的實作和優化方式。

innodb 存儲引擎是基于集合索引實作的資料存儲,也就是除了索引列以及主鍵是存儲在 b + 樹之外,其它列資料也存儲在 b + 樹的葉子節點中。而這裡的索引頁和資料頁都會緩存在緩沖池中,在查詢資料時,隻要在緩沖池中存在該資料,innodb 就不用每次都去磁盤中讀取頁,進而提高資料庫的查詢性能。

雖然緩沖池是一個很大的記憶體區域,但由于存放了各種類型的資料,加上存儲資料量之大,緩沖池無法将所有的資料都存儲在其中。是以,緩沖池需要通過 lru 算法将最近且經常查詢的資料緩存在其中,而不常查詢的資料就淘汰出去。

innodb 對 lru 做了一些優化,我們熟悉的 lru 算法通常是将最近查詢的資料放到 lru 清單的首部,而 innodb 則是将資料放在一個 midpoint 位置,通常這個 midpoint 為清單長度的 5/8。

這種政策主要是為了避免一些不常查詢的操作突然将熱點資料淘汰出去,而熱點資料被再次查詢時,需要再次從磁盤中擷取,進而影響資料庫的查詢性能。

如果我們的熱點資料比較多,我們可以通過調整 midpoint 值來增加熱點資料的存儲量,進而降低熱點資料的淘汰率。

以上 innodb 的實作和運作原理到這裡就介紹完了。總的來講,作為開發工程師,我們應該掌握資料庫幾個大的知識點,然後再深入到資料庫内部實作的細節,這樣才能避免經常寫出一些具有性能問題的 sql,培養調優資料庫性能的能力,整理的一份mysql學習筆記希望能幫助到你們。