redis - 為什麼要用redis？

複習要點：本文圍繞以下幾點進行闡述

1、為什麼使用redis

分析：在項目中使用redis，主要是從兩個角度去考慮:性能和并發。當然，redis還具備可以做分布式鎖等其他功能，但是如果隻是為了分布式鎖這些其他功能，完全還有其他中間件(如zookpeer等)代替，并不是非要使用redis。是以，這個問題主要從性能和并發兩個角度去答。

回答：如下所示，分為兩點

（一）性能如下圖所示，我們在碰到需要執行耗時特别久，且結果不頻繁變動的SQL，就特别适合将運作結果放入緩存。這樣，後面的請求就去緩存中讀取，使得請求能夠迅速響應。

題外話：忽然想聊一下這個迅速響應的标準。其實根據互動效果的不同，這個響應時間沒有固定标準。不過曾經有人這麼告訴我:"在理想狀态下，我們的頁面跳轉需要在瞬間解決，對于頁内操作則需要在刹那間解決。另外，超過一彈指的耗時操作要有進度提示，并且可以随時中止或取消，這樣才能給使用者最好的體驗。" 那麼瞬間、刹那、一彈指具體是多少時間呢？根據《摩诃僧祗律》記載

那麼，經過周密的計算，一瞬間為0.36 秒,一刹那有 0.018 秒.一彈指長達 7.2 秒。

（二）并發如下圖所示，在大并發的情況下，所有的請求直接通路資料庫，資料庫會出現連接配接異常。這個時候，就需要使用redis做一個緩沖操作，讓請求先通路到redis，而不是直接通路資料庫。

2、使用redis有什麼缺點

分析:大家用redis這麼久，這個問題是必須要了解的，基本上使用redis都會碰到一些問題，常見的也就幾個。

回答:主要是四個問題

(一)緩存和資料庫雙寫一緻性問題

(二)緩存雪崩問題

(三)緩存擊穿問題

(四)緩存的并發競争問題

這四個問題，我個人是覺得在項目中，比較常遇見的，具體解決方案，後文給出。

3、單線程的redis為什麼這麼快

分析:這個問題其實是對redis内部機制的一個考察。其實根據部落客的面試經驗，很多人其實都不知道redis是單線程工作模型。是以，這個問題還是應該要複習一下的。

回答:主要是以下三點

　　(一)純記憶體操作

　　(二)單線程操作，避免了頻繁的上下文切換

　　(三)采用了非阻塞I/O多路複用機制

題外話：我們現在要仔細的說一說I/O多路複用機制，因為這個說法實在是太通俗了，通俗到一般人都不懂是什麼意思。部落客打一個比方：小曲在S城開了一家快遞店，負責同城快送服務。小曲因為資金限制，雇傭了一批快遞員，然後小曲發現資金不夠了，隻夠買一輛車送快遞。

經營方式一：客戶每送來一份快遞，小曲就讓一個快遞員盯着，然後快遞員開車去送快遞。慢慢的小曲就發現了這種經營方式存在下述問題 - 幾十個快遞員基本上時間都花在了搶車上了，大部分快遞員都處在閑置狀态，誰搶到了車，誰就能去送快遞 - 随着快遞的增多，快遞員也越來越多，小曲發現快遞店裡越來越擠，沒辦法雇傭新的快遞員了 - 快遞員之間的協調很花時間

綜合上述缺點，小曲痛定思痛，提出了下面的經營方式

經營方式二：小曲隻雇傭一個快遞員。然後呢，客戶送來的快遞，小曲按送達地點标注好，然後依次放在一個地方。最後，那個快遞員依次的去取快遞，一次拿一個，然後開着車去送快遞，送好了就回來拿下一個快遞。

對比上述兩種經營方式對比，是不是明顯覺得第二種，效率更高，更好呢。

在上述比喻中:

每個快遞員------------------>每個線程

每個快遞-------------------->每個socket(I/O流)

快遞的送達地點-------------->socket的不同狀态

客戶送快遞請求-------------->來自用戶端的請求

小曲的經營方式-------------->服務端運作的代碼

一輛車---------------------->CPU的核數

于是我們有如下結論

經營方式一就是傳統的并發模型，每個I/O流(快遞)都有一個新的線程(快遞員)管理。

經營方式二就是I/O多路複用。隻有單個線程(一個快遞員)，通過跟蹤每個I/O流的狀态(每個快遞的送達地點)，來管理多個I/O流。

下面類比到真實的redis線程模型，如圖所示

參照上圖，簡單來說，就是。我們的redis-client在操作的時候，會産生具有不同僚件類型的socket。在服務端，有一段I/0多路複用程式，将其置入隊列之中。然後，檔案事件分派器，依次去隊列中取，轉發到不同的事件處理器中。需要說明的是，這個I/O多路複用機制，redis還提供了select、epoll、evport、kqueue等多路複用函數庫，大家可以自行去了解。

4、redis的資料類型，以及每種資料類型的使用場景

分析：是不是覺得這個問題很基礎，其實我也這麼覺得。然而根據面試經驗發現，至少百分八十的人答不上這個問題。建議，在項目中用到後，再類比記憶，體會更深，不要硬記。基本上，一個合格的程式員，五種類型都會用到。

回答：一共五種

　　(一)String 這個其實沒啥好說的，最正常的set/get操作，value可以是String也可以是數字。一般做一些複雜的計數功能的緩存。

　　(二)hash 這裡value存放的是結構化的對象，比較友善的就是操作其中的某個字段。部落客在做單點登入的時候，就是用這種資料結構存儲使用者資訊，以cookieId作為key，設定30分鐘為緩存過期時間，能很好的模拟出類似session的效果。

　　(三)list 使用List的資料結構，可以做簡單的消息隊列的功能。另外還有一個就是，可以利用lrange指令，做基于redis的分頁功能，性能極佳，使用者體驗好。

　　(四)set 因為set堆放的是一堆不重複值的集合。是以可以做全局去重的功能。為什麼不用JVM自帶的Set進行去重？因為我們的系統一般都是叢集部署，使用JVM自帶的Set，比較麻煩，難道為了一個做一個全局去重，再起一個公共服務，太麻煩了。另外，就是利用交集、并集、差集等操作，可以計算共同喜好，全部的喜好，自己獨有的喜好等功能。

　　(五)sorted set sorted set多了一個權重參數score,集合中的元素能夠按score進行排列。可以做排行榜應用，取TOP N操作。另外，參照另一篇《分布式之延時任務方案解析》，該文指出了sorted set可以用來做延時任務。最後一個應用就是可以做範圍查找。

5、redis的過期政策以及記憶體淘汰機制

分析:這個問題其實相當重要，到底redis有沒用到家，這個問題就可以看出來。比如你redis隻能存5G資料，可是你寫了10G，那會删5G的資料。怎麼删的，這個問題思考過麼？還有，你的資料已經設定了過期時間，但是時間到了，記憶體占用率還是比較高，有思考過原因麼?

回答: redis采用的是定期删除+惰性删除政策。

為什麼不用定時删除政策? 定時删除,用一個定時器來負責監視key,過期則自動删除。雖然記憶體及時釋放，但是十分消耗CPU資源。在大并發請求下，CPU要将時間應用在處理請求，而不是删除key,是以沒有采用這一政策.

定期删除+惰性删除是如何工作的呢?

定期删除，redis預設每個100ms檢查，是否有過期的key,有過期key則删除。需要說明的是，redis不是每個100ms将所有的key檢查一次，而是随機抽取進行檢查(如果每隔100ms,全部key進行檢查，redis豈不是卡死)。是以，如果隻采用定期删除政策，會導緻很多key到時間沒有删除。于是，惰性删除派上用場。也就是說在你擷取某個key的時候，redis會檢查一下，這個key如果設定了過期時間那麼是否過期了？如果過期了此時就會删除。

采用定期删除+惰性删除就沒其他問題了麼?

不是的，如果定期删除沒删除key。然後你也沒即時去請求key，也就是說惰性删除也沒生效。這樣，redis的記憶體會越來越高。那麼就應該采用記憶體淘汰機制。在redis.conf中有一行配置

該配置就是配記憶體淘汰政策的(什麼，你沒配過？好好檢討一下自己)

　　1）noeviction：當記憶體不足以容納新寫入資料時，新寫入操作會報錯。應該沒人用吧。

　　2）allkeys-lru：當記憶體不足以容納新寫入資料時，在鍵空間中，移除最近最少使用的key。推薦使用，目前項目在用這種。

　　3）allkeys-random：當記憶體不足以容納新寫入資料時，在鍵空間中，随機移除某個key。應該也沒人用吧，你不删最少使用Key,去随機删。

　　4）volatile-lru：當記憶體不足以容納新寫入資料時，在設定了過期時間的鍵空間中，移除最近最少使用的key。這種情況一般是把redis既當緩存，又做持久化存儲的時候才用。不推薦

　　5）volatile-random：當記憶體不足以容納新寫入資料時，在設定了過期時間的鍵空間中，随機移除某個key。依然不推薦

　　6）volatile-ttl：當記憶體不足以容納新寫入資料時，在設定了過期時間的鍵空間中，有更早過期時間的key優先移除。不推薦

　　ps：如果沒有設定 expire 的key, 不滿足先決條件(prerequisites); 那麼 volatile-lru, volatile-random 和 volatile-ttl 政策的行為, 和 noeviction(不删除) 基本上一緻。

6、redis和資料庫雙寫一緻性問題

分析:一緻性問題是分布式常見問題，還可以再分為最終一緻性和強一緻性。資料庫和緩存雙寫，就必然會存在不一緻的問題。答這個問題，先明白一個前提。就是如果對資料有強一緻性要求，不能放緩存。我們所做的一切，隻能保證最終一緻性。另外，我們所做的方案其實從根本上來說，隻能說降低不一緻發生的機率，無法完全避免。是以，有強一緻性要求的資料，不能放緩存。

回答:《分布式之資料庫和緩存雙寫一緻性方案解析》給出了詳細的分析，在這裡簡單的說一說。首先，采取正确更新政策，先更新資料庫，再删緩存。其次，因為可能存在删除緩存失敗的問題，提供一個補償措施即可，例如利用消息隊列。

7、如何應對緩存穿透和緩存雪崩問題

分析:這兩個問題，說句實在話，一般中小型傳統軟體企業，很難碰到這個問題。如果有大并發的項目，流量有幾百萬左右。這兩個問題一定要深刻考慮。

回答:如下所示

緩存穿透，即黑客故意去請求緩存中不存在的資料，導緻所有的請求都怼到資料庫上，進而資料庫連接配接異常。

解決方案:

　　(一)利用互斥鎖，緩存失效的時候，先去獲得鎖，得到鎖了，再去請求資料庫。沒得到鎖，則休眠一段時間重試

　　(二)采用異步更新政策，無論key是否取到值，都直接傳回。value值中維護一個緩存失效時間，緩存如果過期，異步起一個線程去讀資料庫，更新緩存。需要做緩存預熱(項目啟動前，先加載緩存)操作。

　　(三)提供一個能迅速判斷請求是否有效的攔截機制，比如，利用布隆過濾器，内部維護一系列合法有效的key。迅速判斷出，請求所攜帶的Key是否合法有效。如果不合法，則直接傳回。

緩存雪崩，即緩存同一時間大面積的失效，這個時候又來了一波請求，結果請求都怼到資料庫上，進而導緻資料庫連接配接異常。

　　(一)給緩存的失效時間，加上一個随機值，避免集體失效。

　　(二)使用互斥鎖，但是該方案吞吐量明顯下降了。

　　(三)雙緩存。我們有兩個緩存，緩存A和緩存B。緩存A的失效時間為20分鐘，緩存B不設失效時間。自己做緩存預熱操作。然後細分以下幾個小點 - I 從緩存A讀資料庫，有則直接傳回 - II A沒有資料，直接從B讀資料，直接傳回，并且異步啟動一個更新線程。 - III 更新線程同時更新緩存A和緩存B。

8、如何解決redis的并發競争問題

分析:這個問題大緻就是，同時有多個子系統去set一個key。這個時候要注意什麼呢？大家思考過麼。需要說明一下，部落客提前百度了一下，發現答案基本都是推薦用redis事務機制。部落客不推薦使用redis的事務機制。因為我們的生産環境，基本都是redis叢集環境，做了資料分片操作。你一個事務中有涉及到多個key操作的時候，這多個key不一定都存儲在同一個redis-server上。是以，redis的事務機制，十分雞肋。

　　(1)如果對這個key操作，不要求順序這種情況下，準備一個分布式鎖，大家去搶鎖，搶到鎖就做set操作即可，比較簡單。

　　(2)如果對這個key操作，要求順序假設有一個key1,系統A需要将key1設定為valueA,系統B需要将key1設定為valueB,系統C需要将key1設定為valueC. 期望按照key1的value值按照 valueA-->valueB-->valueC的順序變化。這種時候我們在資料寫入資料庫的時候，需要儲存一個時間戳。假設時間戳如下

那麼，假設這會系統B先搶到鎖，将key1設定為{valueB 3:05}。接下來系統A搶到鎖，發現自己的valueA的時間戳早于緩存中的時間戳，那就不做set操作了。以此類推。

其他方法，比如利用隊列，将set方法變成串行通路也可以。總之，靈活變通。

redis - 為什麼要用redis？

繼續閱讀

秒懂JVM的三大參數類型，就靠這十個小實驗了初級—中級—進階三個級别的大廠面試真題阿裡雲——Java 實習生/初級美團——Java 中級螞蟻金服——Java 進階基礎篇JVM 篇MySQL 篇Redis 篇

CentOs7 安裝redis4.0 遇到的坑一、CentOs7連接配接網絡二、make檔案的時候出錯三、安裝ruby的redis插件時候報錯最後

docker 搭建Redis 問題解決

如何解決Redis緩存擊穿、雪崩、穿透問題

java 版本的redis-stat不能運作在背景和daemon

redis管理常用指令

django短信驗證碼的後端實作

Redis訂閱了一段時間後訂閱失效了（ redisTemplate.convertAndSend）

2022秋招面試總結（cpp+java+測開）百度測開一面位元組後端一面蝦皮後端一面蝦皮後端二面

資料遷移方法資料遷移原則資料遷移之雙寫方案資料遷移之級聯同步方案

微服務-性能壓測\緩存redis和分布式鎖redisson和SpringCache

Nacos 2.0 更新前後性能對比壓測

Spring資料和Redis

redis叢集資料一緻性_RedisRaft為Redis叢集帶來強大的資料一緻性

supervisor 管理redis 和httpd 環境centos7

Redis簡介一(單機版)發展曆程Redis