一、需求起因
在高并發的業務場景下,資料庫大多數情況都是使用者并發通路最薄弱的環節。是以,就需要使用redis做一個緩沖操作,讓請求先通路到redis,而不是直接通路MySQL等資料庫。
這個業務場景,主要是解決讀資料從Redis緩存,一般都是按照下圖的流程來進行業務操作。
讀取緩存步驟一般沒有什麼問題,但是一旦涉及到資料更新:資料庫和緩存更新,就容易出現緩存(Redis)和資料庫(MySQL)間的資料一緻性問題。
不管是先寫MySQL資料庫,再删除Redis緩存;還是先删除緩存,再寫庫,都有可能出現資料不一緻的情況。舉一個例子:
1.如果删除了緩存Redis,還沒有來得及寫庫MySQL,另一個線程就來讀取,發現緩存為空,則去資料庫中讀取資料寫入緩存,此時緩存中為髒資料。
2.如果先寫了庫,在删除緩存前,寫庫的線程當機了,沒有删除掉緩存,則也會出現資料不一緻情況。
因為寫和讀是并發的,沒法保證順序,就會出現緩存和資料庫的資料不一緻的問題。
如來解決?這裡給出兩個解決方案,先易後難,結合業務和技術代價選擇使用。
二、緩存和資料庫一緻性解決方案
1.第一種方案:采用延時雙删政策
在寫庫前後都進行redis.del(key)操作,并且設定合理的逾時時間。
僞代碼如下:
public void write(String key,Object data){
redis.delKey(key);
db.updateData(data);
Thread.sleep(500);
}
具體的步驟就是:
- 先删除緩存;
- 再寫資料庫;
- 休眠500毫秒;
- 再次删除緩存。
那麼,這個500毫秒怎麼确定的,具體該休眠多久呢?
需要評估自己的項目的讀資料業務邏輯的耗時。這麼做的目的,就是確定讀請求結束,寫請求可以删除讀請求造成的緩存髒資料。
當然這種政策還要考慮redis和資料庫主從同步的耗時。最後的的寫資料的休眠時間:則在讀資料業務邏輯的耗時基礎上,加幾百ms即可。比如:休眠1秒。
設定緩存過期時間
從理論上來說,給緩存設定過期時間,是保證最終一緻性的解決方案。所有的寫操作以資料庫為準,隻要到達緩存過期時間,則後面的讀請求自然會從資料庫中讀取新值然後回填緩存。
該方案的弊端
結合雙删政策+緩存逾時設定,這樣最差的情況就是在逾時時間内資料存在不一緻,而且又增加了寫請求的耗時。
2、第二種方案:異步更新緩存(基于訂閱binlog的同步機制)
技術整體思路:
MySQL binlog增量訂閱消費+消息隊列+增量資料更新到redis
讀Redis:熱資料基本都在Redis
寫MySQL:增删改都是操作MySQL
更新Redis資料:MySQ的資料操作binlog,來更新到Redis
Redis更新
1)資料操作主要分為兩大塊:
一個是全量(将全部資料一次寫入到redis)
一個是增量(實時更新)
這裡說的是增量,指的是mysql的update、insert、delate變更資料。
2)讀取binlog後分析,利用消息隊列,推送更新各台的redis緩存資料。
這樣一旦MySQL中産生了新的寫入、更新、删除等操作,就可以把binlog相關的消息推送至Redis,Redis再根據binlog中的記錄,對Redis進行更新。
其實這種機制,很類似MySQL的主從備份機制,因為MySQL的主備也是通過binlog來實作的資料一緻性。
這裡可以結合使用canal(阿裡的一款開源架構),通過該架構可以對MySQL的binlog進行訂閱,而canal正是模仿了mysql的slave資料庫的備份請求,使得Redis的資料更新達到了相同的效果。
當然,這裡的消息推送工具你也可以采用别的第三方:kafka、rabbitMQ等來實作推送更新Redis。
以上就是Redis和MySQL資料一緻性詳解,覺得不錯請點贊支援。
【mikechen優知】往期博文:
碼了幾年代碼的程式員,有一定的開發經驗,應該如何提升自己? 分布式消息系列:詳解RocketMQ的簡介與演進、架構設計、關鍵特性與應用場景 高并發架構系列:Kafka、RocketMQ、RabbitMQ的優劣勢比較 Java 面試題目最全集合1000+ 大放送,能答對70%就去BATJTMD試試~