本文首發于 vivo網際網路技術 微信公衆号
作者:何志創
一般大家對資料庫事務的了解可能停留在事務的ACID特性以及事務4種不同的隔離級别層面上,而對于事務 4 種不同隔離級别如何實作了解相對較少。
本文以 MySQL 資料庫 InnoDB 引擎為例,為大家分析 InnoDB資料庫引擎對預設的隔離級别可重複讀(RR)的具體實作。
整文知識點介紹:事務4種隔離級别、不同隔離級别解決的問題、MVCC、鎖的類型、加鎖案例分析;閱讀完整文相信大家對事務隔離級别的具體實作有了一定的認識。
一、事務的隔離級别
1、4 種隔離級别
(1)未送出讀(Read uncommitted):一個事務讀取到其他事務未送出的資料,是級别最低的隔離機制;
(2)送出讀(Read committed):一個事務讀取到其他事務送出後的資料;
(3)可重複讀(Repeatable read):一個事務對同一份資料讀取到的相同,不在乎其他事務對資料的修改;
(4)序列化(Serializable) :事務串行化執行,隔離級别最高,犧牲了系統的并發性。
2、不同隔離級别解決的問題
若不考慮事務的隔離級别,則事務的并發會造成以下問題:
(1)髒讀:事務A讀取了事務B更新的資料,然後B復原操作,那麼A讀取到的資料是髒資料。
(2)不可重複讀:事務 A 多次讀取同一資料,事務 B 在事務A多次讀取的過程中,對資料作了更新并送出,導緻事務A多次讀取同一資料時,結果 不一緻。
(3)幻讀:同一事務中對同一範圍的資料進行讀取,結果卻多出了資料或者少了資料,這就叫幻讀。(如同一事務對id<10的範圍進行2次查詢,第一次出現id=8、9的兩條資料,第二次出現id=7、8、9的3條資料)。
不可重複讀的和幻讀很容易混淆,不可重複讀側重于修改,幻讀側重于新增或删除。解決不可重複讀的問題隻需鎖住滿足條件的行,解決幻讀需要鎖表。
不同的隔離級别針對上述3個問題的解決能力,如下表:

二、MVCC
上文提到 InnoDB 預設的隔離級别是可重複讀(RR),InnoDB是通過MVCC(多版本并發控制)來實作可重複讀的,下面為大家介紹MVCC。
1、概念
在InnoDB中,給每行增加兩個隐藏字段來實作MVCC,一個用來記錄資料行的建立時間,另一個用來記錄行的過期時間(删除時間)。在實際操作中,存儲的并不是時間,而是事務的版本号,每開啟一個新事務,事務的版本号就會遞增。
于是乎,預設的隔離級别(REPEATABLE READ)下,增删查改變成了這樣:
(1)SELECT
- 讀取建立版本小于或等于目前事務版本号,并且删除版本為空或大于目前事務版本号的記錄。這樣可以保證在讀取之前記錄是存在的。
(2)INSERT
- 将目前事務的版本号儲存至行的建立版本号。
(3)UPDATE
- 新插入一行,并以目前事務的版本号作為新行的建立版本号,同時将原記錄行的删除版本号設定為目前事務版本号。
(4)DELETE
- 将目前事務的版本号儲存至行的删除版本号。
2、快照讀和目前讀
(1)快照讀:讀取的是快照版本,也就是曆史版本;
(2)目前讀:讀取的是最新版本。
普通的SELECT就是快照讀,而UPDATE、DELETE、INSERT、SELECT ... LOCK IN SHARE MODE、SELECT ... FOR UPDATE是目前讀。
(3)結論:如果隔離級别是REPEATABLE READ,那麼在同一個事務中的所有普通select讀讀到的都是事務第一個讀到的快照,如此實作了可重複讀;而對于目前讀(UPDATE、DELETE、INSERT、SELECT ... LOCK IN SHARE MODE、SELECT ... FOR UPDATE),InnoDB 通過加鎖來實作可重複讀,且InnoDB 加鎖同時解決了幻讀問題。
三、鎖的類型
InnoDB 引入以下三種鎖類型:
- Record Locks(記錄鎖):在索引記錄上加鎖,即行鎖,鎖住目前行。
- Gap Locks(間隙鎖):在索引記錄之間加鎖,或者在第一個索引記錄之前加鎖,或者在最後一個索引記錄之後加鎖。
- Next-Key Locks:在索引記錄上加鎖,并且在索引記錄之前的間隙加鎖。它相當于是Record Locks與Gap Locks的一個結合。
假設一個索引包含以下幾個值:10,11,13,20。那麼這個索引的next-key鎖将會覆寫以下區間:(-oo, 10]、(10, 11]、(11, 13]、(13, 20]、(20, +oo)。
MySQL InnoDB 通過間隙鎖解決了幻讀問題。以下通過實際的案例分析來介紹InnoDB 是如果解決幻讀問題的。
四、案例分析
在對SQL進行加鎖分析前,需要明确表的結構和索引類型。在不知道索引的情況下直接給出一條SQL來分析如果加鎖是沒有任何意義的。
以下以使用者表(t_user)為例(id為主鍵,name為唯一索引,age為一般索引,address無索引)分析不同索引條件的加鎖表現。
1、主鍵索引
例:delete from t_user where id=120;
條件為主鍵,此時鎖住聚簇索引中對應的行記錄:即Record Locks鎖住id=120的行記錄。
此種情況下,其他事務除了不能删除、更新此條記錄外,其他插入其他行、更新其他行都行。
SQL驗證:
2、唯一索引
例:delete from t_user where name='n20';
條件為唯一索引,鎖住索引記錄,同時鎖住聚簇索引中的對應行記錄:
3、一般索引
例:delete from t_user where age=20;
與主鍵和唯一索引不同的是,一般索引的記錄是允許重複的;換句話說,如果我們單純地給索引加記錄鎖時,其他事務依然可以插入,也就有可能出現幻讀問題了。
是以除了給對應索引記錄加上記錄鎖之外,還要給Gap加上鎖。
從上面知識點我們可以預估這個操作一共需要的鎖:
- age索引記錄鎖(Record Lock) :
20\_120, 20\_130(以下均用age_id這種形式表示索引值)
- age索引間隙鎖(Gap X-Lock):
(10, 20)、(20, 20)、(20, 40)
- 聚簇索引上的記錄鎖(Record X-Lock):
id=120/130對應的行記錄
根據實際情況,3-6均符合我們預期,然而7和8則超出了我們預期的鎖範圍。為什麼會超出我們預期呢?此次我們進行分析一下:
從7、8插入語句來看,由于id為自增主鍵,會自動遞增,語句7插入值預計為:10_141;
語句8插入值預計為:40_141,為什麼隻有後者能插入呢?
其實我們可以将B+樹中的間隙了解得更加精準一點:
age=20的三個間隙應該為:(10_110, 20_120)、(20_120, 20_130)、(20_130, 40_140);
從上圖可以看出語句7插入值10_141 無法插入,因為間隙被鎖住了;而語句8插入 40_141值因為在間隙之外了,無鎖沖突,允許插入。
是以最終的加鎖情況應該這樣表示:
- age索引記錄鎖(Record Lock) :20_120, 20_130
- age索引間隙鎖(Gap X-Lock):(10_110, 20_120)、(20_120, 20_130)、(20_130, 40_140)
- 聚簇索引上的記錄鎖(Record X-Lock):id=120/130對應的行記錄
4、無索引
delete from t_user where address='a20',因為無法精準定位,InnoDB選擇将聚簇索引中的所有行以及間隙都鎖起來,功能上已經等于鎖表了:
5、結論
InnoDB 在RC(READ COMMITTED)隔離級别中,隻會在對應的索引/行記錄上加Record Lock,而不會加Gap鎖,原因也很簡單,因為該隔離級别是允許存在幻讀問題的。
在RR級别下的加鎖方式稱之為Next-Key Locks,其實就是上述Record Locks和Gap Locks的結合。比如Gap Lock為(10,20) ,record lock為20,結合的Next-Key lock 為:(10, 20]。
分析Next-Key Locks其實就是要分析Record Locks和Gap Locks。MySQL InnoDB的可重複讀并不保證避免幻讀,需要應用使用加鎖讀來保證。而這個加鎖讀使用到的機制就是next-key locks。
如果使用普通的讀,會得到一緻性的結果,如果使用了加鎖的讀,就會讀到“最新的”“送出”讀的結果。本身,可重複讀和送出讀是沖突的。在同一個事務裡,如果保證了可重複讀,
就會看不到其他事務的送出,違背了送出讀;如果保證了送出讀,就會導緻前後兩次讀到的結果不一緻,違背了可重複讀。可以這麼講,InnoDB提供了這樣的機制,在預設的可重複讀的隔離級别裡,可以使用加鎖讀去查詢最新的資料。