天天看點

緩存與資料庫雙寫一緻問題

緩存與資料庫雙寫一緻問題

在高并發的業務場景下,資料庫大多數情況都是使用者并發通路最薄弱的環節。是以,就需要使用redis做一個緩沖操作,讓請求先通路到redis,而不是直接通路MySQL等資料庫。

緩存與資料庫雙寫一緻問題

這個業務場景,主要是解決讀資料從Redis緩存,一般都是按照下圖的流程來進行業務操作。

緩存與資料庫雙寫一緻問題

讀取緩存步驟一般沒有什麼問題,但是一旦涉及到資料更新:資料庫和緩存更新,就容易出現緩存(Redis)和資料庫(MySQL)間的資料一緻性問題。

不管是先寫MySQL資料庫,再删除Redis緩存;還是先删除緩存,再寫庫,都有可能出現資料不一緻的情況。舉一個例子:

1.如果删除了緩存Redis,還沒有來得及寫庫MySQL,另一個線程就來讀取,發現緩存為空,則去資料庫中讀取資料寫入緩存,此時緩存中為髒資料。

2.如果先寫了庫,在删除緩存前,寫庫的線程當機了,沒有删除掉緩存,則也會出現資料不一緻情況。

因為寫和讀是并發的,沒法保證順序,就會出現緩存和資料庫的資料不一緻的問題。

如來解決?這裡給出兩個解決方案,先易後難,結合業務和技術代價選擇使用。

緩存和資料庫一緻性解決方案

采用延時雙删政策

在寫庫前後都進行redis.del(key)操作,并且設定合理的逾時時間。

僞代碼如下:

public void write(String key,Object data){
  redis.delKey(key);
  db.updateData(data);
  Thread.sleep(500);
  redis.delKey(key);
 }      

具體的步驟就是:

  • 先删除緩存;
  • 再寫資料庫;
  • 休眠500毫秒;
  • 再次删除緩存。

那麼,這個500毫秒怎麼确定的,具體該休眠多久呢?

需要評估自己的項目的讀資料業務邏輯的耗時。這麼做的目的,就是確定讀請求結束,寫請求可以删除讀請求造成的緩存髒資料。

當然這種政策還要考慮redis和資料庫主從同步的耗時。最後的的寫資料的休眠時間:則在讀資料業務邏輯的耗時基礎上,加幾百ms即可。比如:休眠1秒。

設定緩存過期時間

從理論上來說,給緩存設定過期時間,是保證最終一緻性的解決方案。所有的寫操作以資料庫為準,隻要到達緩存過期時間,則後面的讀請求自然會從資料庫中讀取新值然後回填緩存。

該方案的弊端

結合雙删政策+緩存逾時設定,這樣最差的情況就是在逾時時間内資料存在不一緻,而且又增加了寫請求的耗時。

異步更新緩存(基于訂閱binlog的同步機制)

技術整體思路:

MySQL binlog增量訂閱消費+消息隊列+增量資料更新到redis

  • 讀Redis:熱資料基本都在Redis
  • 寫MySQL:增删改都是操作MySQL
  • 更新Redis資料:MySQ的資料操作binlog,來更新到Redis

補充:什麼是binlog

binlog是一個二進制格式的檔案,用于記錄使用者對資料庫更新的SQL語句資訊,例如更改資料庫表和更改内容的SQL語句都會記錄到binlog裡,但是對庫表等内容的查詢不會記錄。

預設情況下,binlog日志是二進制格式的,不能使用檢視文本工具的指令(比如,cat,vi等)檢視,而使用mysqlbinlog解析檢視。

當有資料寫入到資料庫時,還會同時把更新的SQL語句寫入到對應的binlog檔案裡,這個檔案就是上文說的binlog檔案。使用mysqldump備份時,隻是對一段時間的資料進行全備,但是如果備份後突然發現資料庫伺服器故障,這個時候就要用到binlog的日志了。

Redis更新

1)資料操作主要分為兩大塊:

  • 一個是全量(将全部資料一次寫入到redis)
  • 一個是增量(實時更新)

這裡說的是增量,指的是mysql的update、insert、delate變更資料。

2)讀取binlog後分析 ,利用消息隊列,推送更新各台的redis緩存資料。

這樣一旦MySQL中産生了新的寫入、更新、删除等操作,就可以把binlog相關的消息推送至Redis,Redis再根據binlog中的記錄,對Redis進行更新。

其實這種機制,很類似MySQL的主從備份機制,因為MySQL的主備也是通過binlog來實作的資料一緻性。