天天看點

redis - 為什麼要用redis?

 複習要點:本文圍繞以下幾點進行闡述

 1、為什麼使用redis

 分析:在項目中使用redis,主要是從兩個角度去考慮:性能和并發。當然,redis還具備可以做分布式鎖等其他功能,但是如果隻是為了分布式鎖這些其他功能,完全還有其他中間件(如zookpeer等)代替,并不是非要使用redis。是以,這個問題主要從性能和并發兩個角度去答。

 回答:如下所示,分為兩點

 (一)性能 如下圖所示,我們在碰到需要執行耗時特别久,且結果不頻繁變動的SQL,就特别适合将運作結果放入緩存。這樣,後面的請求就去緩存中讀取,使得請求能夠迅速響應。

redis - 為什麼要用redis?

 題外話:忽然想聊一下這個迅速響應的标準。其實根據互動效果的不同,這個響應時間沒有固定标準。不過曾經有人這麼告訴我:"在理想狀态下,我們的頁面跳轉需要在瞬間解決,對于頁内操作則需要在刹那間解決。另外,超過一彈指的耗時操作要有進度提示,并且可以随時中止或取消,這樣才能給使用者最好的體驗。" 那麼瞬間、刹那、一彈指具體是多少時間呢? 根據《摩诃僧祗律》記載

 那麼,經過周密的計算,一瞬間為0.36 秒,一刹那有 0.018 秒.一彈指長達 7.2 秒。

 (二)并發 如下圖所示,在大并發的情況下,所有的請求直接通路資料庫,資料庫會出現連接配接異常。這個時候,就需要使用redis做一個緩沖操作,讓請求先通路到redis,而不是直接通路資料庫。

 2、使用redis有什麼缺點

 分析:大家用redis這麼久,這個問題是必須要了解的,基本上使用redis都會碰到一些問題,常見的也就幾個。

 回答:主要是四個問題

(一)緩存和資料庫雙寫一緻性問題

(二)緩存雪崩問題

(三)緩存擊穿問題

(四)緩存的并發競争問題

 這四個問題,我個人是覺得在項目中,比較常遇見的,具體解決方案,後文給出。

 3、單線程的redis為什麼這麼快

 分析:這個問題其實是對redis内部機制的一個考察。其實根據部落客的面試經驗,很多人其實都不知道redis是單線程工作模型。是以,這個問題還是應該要複習一下的。

 回答:主要是以下三點

  (一)純記憶體操作

  (二)單線程操作,避免了頻繁的上下文切換

  (三)采用了非阻塞I/O多路複用機制

 題外話:我們現在要仔細的說一說I/O多路複用機制,因為這個說法實在是太通俗了,通俗到一般人都不懂是什麼意思。部落客打一個比方:小曲在S城開了一家快遞店,負責同城快送服務。小曲因為資金限制,雇傭了一批快遞員,然後小曲發現資金不夠了,隻夠買一輛車送快遞。

 經營方式一:客戶每送來一份快遞,小曲就讓一個快遞員盯着,然後快遞員開車去送快遞。慢慢的小曲就發現了這種經營方式存在下述問題 - 幾十個快遞員基本上時間都花在了搶車上了,大部分快遞員都處在閑置狀态,誰搶到了車,誰就能去送快遞 - 随着快遞的增多,快遞員也越來越多,小曲發現快遞店裡越來越擠,沒辦法雇傭新的快遞員了 - 快遞員之間的協調很花時間

 綜合上述缺點,小曲痛定思痛,提出了下面的經營方式

 經營方式二:小曲隻雇傭一個快遞員。然後呢,客戶送來的快遞,小曲按送達地點标注好,然後依次放在一個地方。最後,那個快遞員依次的去取快遞,一次拿一個,然後開着車去送快遞,送好了就回來拿下一個快遞。

 對比 上述兩種經營方式對比,是不是明顯覺得第二種,效率更高,更好呢。

 在上述比喻中:

每個快遞員------------------>每個線程

每個快遞-------------------->每個socket(I/O流)

快遞的送達地點-------------->socket的不同狀态

客戶送快遞請求-------------->來自用戶端的請求

小曲的經營方式-------------->服務端運作的代碼

一輛車---------------------->CPU的核數

 于是我們有如下結論

經營方式一就是傳統的并發模型,每個I/O流(快遞)都有一個新的線程(快遞員)管理。

經營方式二就是I/O多路複用。隻有單個線程(一個快遞員),通過跟蹤每個I/O流的狀态(每個快遞的送達地點),來管理多個I/O流。

 下面類比到真實的redis線程模型,如圖所示

redis - 為什麼要用redis?

 參照上圖,簡單來說,就是。我們的redis-client在操作的時候,會産生具有不同僚件類型的socket。在服務端,有一段I/0多路複用程式,将其置入隊列之中。然後,檔案事件分派器,依次去隊列中取,轉發到不同的事件處理器中。 需要說明的是,這個I/O多路複用機制,redis還提供了select、epoll、evport、kqueue等多路複用函數庫,大家可以自行去了解。

 4、redis的資料類型,以及每種資料類型的使用場景

 分析:是不是覺得這個問題很基礎,其實我也這麼覺得。然而根據面試經驗發現,至少百分八十的人答不上這個問題。建議,在項目中用到後,再類比記憶,體會更深,不要硬記。基本上,一個合格的程式員,五種類型都會用到。

 回答:一共五種

  (一)String 這個其實沒啥好說的,最正常的set/get操作,value可以是String也可以是數字。一般做一些複雜的計數功能的緩存。

  (二)hash 這裡value存放的是結構化的對象,比較友善的就是操作其中的某個字段。部落客在做單點登入的時候,就是用這種資料結構存儲使用者資訊,以cookieId作為key,設定30分鐘為緩存過期時間,能很好的模拟出類似session的效果。

  (三)list 使用List的資料結構,可以做簡單的消息隊列的功能。另外還有一個就是,可以利用lrange指令,做基于redis的分頁功能,性能極佳,使用者體驗好。

  (四)set 因為set堆放的是一堆不重複值的集合。是以可以做全局去重的功能。為什麼不用JVM自帶的Set進行去重?因為我們的系統一般都是叢集部署,使用JVM自帶的Set,比較麻煩,難道為了一個做一個全局去重,再起一個公共服務,太麻煩了。 另外,就是利用交集、并集、差集等操作,可以計算共同喜好,全部的喜好,自己獨有的喜好等功能。

  (五)sorted set sorted set多了一個權重參數score,集合中的元素能夠按score進行排列。可以做排行榜應用,取TOP N操作。另外,參照另一篇《分布式之延時任務方案解析》,該文指出了sorted set可以用來做延時任務。最後一個應用就是可以做範圍查找。

 5、redis的過期政策以及記憶體淘汰機制

 分析:這個問題其實相當重要,到底redis有沒用到家,這個問題就可以看出來。比如你redis隻能存5G資料,可是你寫了10G,那會删5G的資料。怎麼删的,這個問題思考過麼?還有,你的資料已經設定了過期時間,但是時間到了,記憶體占用率還是比較高,有思考過原因麼?

 回答: redis采用的是定期删除+惰性删除政策。

 為什麼不用定時删除政策? 定時删除,用一個定時器來負責監視key,過期則自動删除。雖然記憶體及時釋放,但是十分消耗CPU資源。在大并發請求下,CPU要将時間應用在處理請求,而不是删除key,是以沒有采用這一政策.

 定期删除+惰性删除是如何工作的呢?

 定期删除,redis預設每個100ms檢查,是否有過期的key,有過期key則删除。需要說明的是,redis不是每個100ms将所有的key檢查一次,而是随機抽取進行檢查(如果每隔100ms,全部key進行檢查,redis豈不是卡死)。是以,如果隻采用定期删除政策,會導緻很多key到時間沒有删除。 于是, 惰性删除派上用場。也就是說在你擷取某個key的時候,redis會檢查一下,這個key如果設定了過期時間那麼是否過期了?如果過期了此時就會删除。

 采用定期删除+惰性删除就沒其他問題了麼?

 不是的,如果定期删除沒删除key。然後你也沒即時去請求key,也就是說惰性删除也沒生效。這樣,redis的記憶體會越來越高。那麼就應該采用記憶體淘汰機制。 在redis.conf中有一行配置

該配置就是配記憶體淘汰政策的(什麼,你沒配過?好好檢討一下自己)

  1)noeviction:當記憶體不足以容納新寫入資料時,新寫入操作會報錯。應該沒人用吧。

  2)allkeys-lru:當記憶體不足以容納新寫入資料時,在鍵空間中,移除最近最少使用的key。推薦使用,目前項目在用這種。

  3)allkeys-random:當記憶體不足以容納新寫入資料時,在鍵空間中,随機移除某個key。應該也沒人用吧,你不删最少使用Key,去随機删。

  4)volatile-lru:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,移除最近最少使用的key。這種情況一般是把redis既當緩存,又做持久化存儲的時候才用。不推薦

  5)volatile-random:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,随機移除某個key。依然不推薦 

  6)volatile-ttl:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,有更早過期時間的key優先移除。不推薦 

  ps:如果沒有設定 expire 的key, 不滿足先決條件(prerequisites); 那麼 volatile-lru, volatile-random 和 volatile-ttl 政策的行為, 和 noeviction(不删除) 基本上一緻。

 6、redis和資料庫雙寫一緻性問題

 分析:一緻性問題是分布式常見問題,還可以再分為最終一緻性和強一緻性。資料庫和緩存雙寫,就必然會存在不一緻的問題。答這個問題,先明白一個前提。就是如果對資料有強一緻性要求,不能放緩存。我們所做的一切,隻能保證最終一緻性。另外,我們所做的方案其實從根本上來說,隻能說降低不一緻發生的機率,無法完全避免。是以,有強一緻性要求的資料,不能放緩存。

 回答:​​《分布式之資料庫和緩存雙寫一緻性方案解析》​​給出了詳細的分析,在這裡簡單的說一說。首先,采取正确更新政策,先更新資料庫,再删緩存。其次,因為可能存在删除緩存失敗的問題,提供一個補償措施即可,例如利用消息隊列。

 7、如何應對緩存穿透和緩存雪崩問題

 分析:這兩個問題,說句實在話,一般中小型傳統軟體企業,很難碰到這個問題。如果有大并發的項目,流量有幾百萬左右。這兩個問題一定要深刻考慮。

 回答:如下所示

 緩存穿透,即黑客故意去請求緩存中不存在的資料,導緻所有的請求都怼到資料庫上,進而資料庫連接配接異常。

 解決方案:

  (一)利用互斥鎖,緩存失效的時候,先去獲得鎖,得到鎖了,再去請求資料庫。沒得到鎖,則休眠一段時間重試

  (二)采用異步更新政策,無論key是否取到值,都直接傳回。value值中維護一個緩存失效時間,緩存如果過期,異步起一個線程去讀資料庫,更新緩存。需要做緩存預熱(項目啟動前,先加載緩存)操作。

  (三)提供一個能迅速判斷請求是否有效的攔截機制,比如,利用布隆過濾器,内部維護一系列合法有效的key。迅速判斷出,請求所攜帶的Key是否合法有效。如果不合法,則直接傳回。

 緩存雪崩,即緩存同一時間大面積的失效,這個時候又來了一波請求,結果請求都怼到資料庫上,進而導緻資料庫連接配接異常。

  (一)給緩存的失效時間,加上一個随機值,避免集體失效。

  (二)使用互斥鎖,但是該方案吞吐量明顯下降了。

  (三)雙緩存。我們有兩個緩存,緩存A和緩存B。緩存A的失效時間為20分鐘,緩存B不設失效時間。自己做緩存預熱操作。然後細分以下幾個小點 - I 從緩存A讀資料庫,有則直接傳回 - II A沒有資料,直接從B讀資料,直接傳回,并且異步啟動一個更新線程。 - III 更新線程同時更新緩存A和緩存B。

 8、如何解決redis的并發競争問題

 分析:這個問題大緻就是,同時有多個子系統去set一個key。這個時候要注意什麼呢?大家思考過麼。需要說明一下,部落客提前百度了一下,發現答案基本都是推薦用redis事務機制。部落客不推薦使用redis的事務機制。因為我們的生産環境,基本都是redis叢集環境,做了資料分片操作。你一個  事務中有涉及到多個key操作的時候,這多個key不一定都存儲在同一個redis-server上。是以,redis的事務機制,十分雞肋。

  (1)如果對這個key操作,不要求順序 這種情況下,準備一個分布式鎖,大家去搶鎖,搶到鎖就做set操作即可,比較簡單。

  (2)如果對這個key操作,要求順序 假設有一個key1,系統A需要将key1設定為valueA,系統B需要将key1設定為valueB,系統C需要将key1設定為valueC. 期望按照key1的value值按照 valueA-->valueB-->valueC的順序變化。這種時候我們在資料寫入資料庫的時候,需要儲存一個時間戳。假設時間戳如下

 那麼,假設這會系統B先搶到鎖,将key1設定為{valueB 3:05}。接下來系統A搶到鎖,發現自己的valueA的時間戳早于緩存中的時間戳,那就不做set操作了。以此類推。

 其他方法,比如利用隊列,将set方法變成串行通路也可以。總之,靈活變通。

繼續閱讀