天天看點

6個常見的高并發緩存問題,你知道幾個?前言緩存一緻性問題緩存并發問題緩存穿透問題緩存颠簸問題緩存的雪崩現象緩存無底洞現象

前言

一般來說,現在的網際網路應用網站或者APP,它的整體流程可以用我們這個圖裡展示的來表示,使用者請求開始,從這個界面是最裡面的浏覽器和APP,到網絡轉發,再到應用服務,最後到存儲,這純屬可能是資料庫檔案系統,然後再傳回到界面呈現内容。

6個常見的高并發緩存問題,你知道幾個?前言緩存一緻性問題緩存并發問題緩存穿透問題緩存颠簸問題緩存的雪崩現象緩存無底洞現象

随着網際網路的普及,内容資訊越來越複雜,使用者數和通路量越來越大,我們的應用需要支撐更多的并發量,同時,我們的應用伺服器和資料庫伺服器所做的計算也越來越多,但是,往往我們的應用伺服器的資源是有限的,而且技術變革是緩慢的,是以每秒能接收請求次數也是有限的,或者說檔案的讀寫也是有限的。

如何能有效利用有限的資源來提供盡可能大的吞吐量呢?一個有效的辦法就是引入緩存,打破圖中的标準的流程,每個環節中請求可以從緩存中直接擷取目标資料并傳回,進而減少他們的計算量,來有效提升響應速度,讓有限的資源服務更多的使用者,像我們這個圖裡展示的緩存的使用,它其實可以出現在1到4的各個環節中。

緩存一緻性問題

當資料時效性要求很高時,需要保證緩存中的資料與資料庫中的保持一緻,而且需要保證緩存節點和副本中的資料也保持一緻,不能出現差異現象。

這就比較依賴緩存的過期和更新政策。一般會在資料發生更改的時,主動更新緩存中的資料或者移除對應的緩存。

6個常見的高并發緩存問題,你知道幾個?前言緩存一緻性問題緩存并發問題緩存穿透問題緩存颠簸問題緩存的雪崩現象緩存無底洞現象

緩存并發問題

緩存過期後将嘗試從後端資料庫擷取資料,這是一個看似合理的流程。但是,在高并發場景下,有可能多個請求并發的去從資料庫擷取資料,對後端資料庫造成極大的沖擊,甚至導緻 “雪崩”現象。

此外,當某個緩存key在被更新時,同時也可能被大量請求在擷取,這也會導緻一緻性的問題。那如何避免類似問題呢?

我們會想到類似“鎖”的機制,在緩存更新或者過期的情況下,先嘗試擷取到鎖,當更新或者從資料庫擷取完成後再釋放鎖,其他的請求隻需要犧牲一定的等待時間,即可直接從緩存中繼續擷取資料。

6個常見的高并發緩存問題,你知道幾個?前言緩存一緻性問題緩存并發問題緩存穿透問題緩存颠簸問題緩存的雪崩現象緩存無底洞現象

緩存穿透問題

緩存穿透在有些地方也稱為“擊穿”。很多朋友對緩存穿透的了解是:由于緩存故障或者緩存過期導緻大量請求穿透到後端資料庫伺服器,進而對資料庫造成巨大沖擊。

這其實是一種誤解。真正的緩存穿透應該是這樣的:

在高并發場景下,如果某一個key被高并發通路,沒有被命中,出于對容錯性考慮,會嘗試去從後端資料庫中擷取,進而導緻了大量請求達到資料庫,而當該key對應的資料本身就是空的情況下,這就導緻資料庫中并發的去執行了很多不必要的查詢操作,進而導緻巨大沖擊和壓力。

可以通過下面的幾種常用方式來避免緩存傳統問題:

1、緩存空對象

對查詢結果為空的對象也進行緩存,如果是集合,可以緩存一個空的集合(非null),如果是緩存單個對象,可以通過字段辨別來區分。這樣避免請求穿透到後端資料庫。

同時,也需要保證緩存資料的時效性。這種方式實作起來成本較低,比較适合命中不高,但可能被頻繁更新的資料。

2、單獨過濾處理

對所有可能對應資料為空的key進行統一的存放,并在請求前做攔截,這樣避免請求穿透到後端資料庫。這種方式實作起來相對複雜,比較适合命中不高,但是更新不頻繁的資料。

6個常見的高并發緩存問題,你知道幾個?前言緩存一緻性問題緩存并發問題緩存穿透問題緩存颠簸問題緩存的雪崩現象緩存無底洞現象

緩存颠簸問題

緩存的颠簸問題,有些地方可能被成為“緩存抖動”,可以看做是一種比“雪崩”更輕微的故障,但是也會在一段時間内對系統造成沖擊和性能影響。一般是由于緩存節點故障導緻。業内推薦的做法是通過一緻性Hash算法來解決。

歡迎大家關注我的公種浩【程式員追風】,文章都會在裡面更新,整理的資料也會放在裡面。

緩存的雪崩現象

緩存雪崩就是指由于緩存的原因,導緻大量請求到達後端資料庫,進而導緻資料庫崩潰,整個系統崩潰,發生災難。

導緻這種現象的原因有很多種,上面提到的“緩存并發”,“緩存穿透”,“緩存颠簸”等問題,其實都可能會導緻緩存雪崩現象發生。這些問題也可能會被惡意攻擊者所利用。

還有一種情況,例如某個時間點内,系統預加載的緩存周期性集中失效了,也可能會導緻雪崩。為了避免這種周期性失效,可以通過設定不同的過期時間,來錯開緩存過期,進而避免緩存集中失效。

從應用架構角度,我們可以通過限流、降級、熔斷等手段來降低影響,也可以通過多級緩存來避免這種災難。

此外,從整個研發體系流程的角度,應該加強壓力測試,盡量模拟真實場景,盡早的暴露問題進而防範。

緩存無底洞現象

該問題由 facebook 的從業人員提出的, facebook 在 2010 年左右,memcached 節點就已經達3000 個,緩存數千 G 内容。

他們發現了一個問題---memcached 連接配接頻率,效率下降了,于是加 memcached 節點,添加了後,發現因為連接配接頻率導緻的問題,仍然存在,并沒有好轉,稱之為”無底洞現象”。

目前主流的資料庫、緩存、Nosql、搜尋中間件等技術棧中,都支援“分片”技術,來滿足“高性能、高并發、高可用、可擴充”等要求。

有些是在client端通過Hash取模(或一緻性Hash)将值映射到不同的執行個體上,有些是在client端通過範圍取值的方式映射的。當然,也有些是在服務端進行的。

但是,每一次操作都可能需要和不同節點進行網絡通信來完成,執行個體節點越多,則開銷會越大,對性能影響就越大。

主要可以從如下幾個方面避免和優化:

1、資料分布方式

有些業務資料可能适合Hash分布,而有些業務适合采用範圍分布,這樣能夠從一定程度避免網絡IO的開銷。

2、IO優化

可以充分利用連接配接池,NIO等技術來盡可能降低連接配接開銷,增強并發連接配接能力。

3、資料通路方式

一次性擷取大的資料集,會比分多次去擷取小資料集的網絡IO開銷更小。

當然,緩存無底洞現象并不常見。在絕大多數的公司裡可能根本不會遇到。

最後

歡迎大家一起交流,喜歡文章記得點個贊喲,感謝支援!