Redis 的 3 種叢集方案對比，寫得非常好！

之前我們提到，為了保證Redis的高可用，主要需要以下幾個方面：

資料持久化

主從複制

自動故障恢複

叢集化

我們簡單理一下這幾個方案的特點，以及它們之間的聯系。

資料持久化本質上是為了做資料備份，有了資料持久化，當Redis當機時，我們可以把資料從磁盤上恢複回來，但在資料恢複之前，服務是不可用的，而且資料恢複的時間取決于執行個體的大小，資料量越大，恢複起來越慢。

而主從複制則是部署多個副本節點，多個副本節點實時複制主節點的資料，當主節點當機時，我們有完整的副本節點可以使用。另一方面，如果我們業務的讀請求量很大，主節點無法承受所有的讀請求，多個副本節點可以分擔讀請求，實作讀寫分離，這樣可以提高Redis的通路性能。

但有個問題是，當主節點當機時，我們雖然有完整的副本節點，但需要手動操作把從節點提升為主節點繼續提供服務，如果每次主節點故障，都需要人工操作，這個過程既耗時耗力，也無法保證及時性，高可用的程度将大打折扣。如何優化呢？

有了資料持久化、主從複制、故障自動恢複這些功能，我們在使用Redis時是不是就可以高枕無憂了？

答案是否定的，如果我們的業務大部分都是讀請求，可以使用讀寫分離提升性能。但如果寫請求量也很大呢？現在是大資料時代，像阿裡、騰訊這些大體量的公司，每時每刻都擁有非常大的寫入量，此時如果隻有一個主節點是無法承受的，那如何處理呢？

這就需要叢集化！簡單來說實作方式就是，多個主從節點構成一個叢集，每個節點存儲一部分資料，這樣寫請求也可以分散到多個主節點上，解決寫壓力大的問題。同時，叢集化可以在節點容量不足和性能不夠時，動态增加新的節點，對進群進行擴容，提升性能。

從這篇文章開始，我們就開始介紹Redis的叢集化方案。當然，叢集化也意味着Redis部署架構更複雜，管理和維護起來成本也更高。而且在使用過程中，也會遇到很多問題，這也衍生出了不同的叢集化解決方案，它們的側重點各不相同。

叢集化方案

要想實作叢集化，就必須部署多個主節點，每個主節點還有可能有多個從節點，以這樣的部署結構組成的叢集，才能更好地承擔更大的流量請求和存儲更多的資料。

可以承擔更大的流量是叢集最基礎的功能，一般叢集化方案還包括了上面提到了資料持久化、資料複制、故障自動恢複功能，利用這些技術，來保證叢集的高性能和高可用。

另外，優秀的叢集化方案還實作了線上水準擴容功能，當節點數量不夠時，可以動态增加新的節點來提升整個叢集的性能，而且這個過程是線上完成的，業務無感覺。

業界主流的Redis叢集化方案主要包括以下幾個：

用戶端分片

Codis

Twemproxy

Redis Cluster

它們還可以用是否中心化來劃分，其中用戶端分片、Redis Cluster屬于無中心化的叢集方案，Codis、Tweproxy屬于中心化的叢集方案。

是否中心化是指用戶端通路多個Redis節點時，是直接通路還是通過一個中間層Proxy來進行操作，直接通路的就屬于無中心化的方案，通過中間層Proxy通路的就屬于中心化的方案，它們有各自的優劣，下面分别來介紹。

用戶端分片主要是說，我們隻需要部署多個Redis節點，具體如何使用這些節點，主要工作在用戶端。

用戶端通過固定的Hash算法，針對不同的key計算對應的Hash值，然後對不同的Redis節點進行讀寫。

用戶端分片需要業務開發人員事先評估業務的請求量和資料量，然後讓DBA部署足夠的節點交給開發人員使用即可。

這個方案的優點是部署非常友善，業務需要多少個節點DBA直接部署傳遞即可，剩下的事情就需要業務開發人員根據節點數量來編寫key的請求路由邏輯，制定一個規則，一般采用固定的Hash算法，把不同的key寫入到不同的節點上，然後再根據這個規則進行資料讀取。

可見，它的缺點是業務開發人員使用Redis的成本較高，需要編寫路由規則的代碼來使用多個節點，而且如果事先對業務的資料量評估不準确，後期的擴容和遷移成本非常高，因為節點數量發生變更後，Hash算法對應的節點也就不再是之前的節點了。

是以後來又衍生出了一緻性雜湊演算法，就是為了解決當節點數量變更時，盡量減少資料的遷移和性能問題。

這種用戶端分片的方案一般用于業務資料量比較穩定，後期不會有大幅度增長的業務場景下使用，隻需要前期評估好業務資料量即可。

随着業務和技術的發展，人們越發覺得，當我需要使用Redis時，我們不想關心叢集後面有多少個節點，我們希望我們使用的Redis是一個大叢集，當我們的業務量增加時，這個大叢集可以增加新的節點來解決容量不夠用和性能問題。

這種方式就是服務端分片方案，用戶端不需要關心叢集後面有多少個Redis節點，隻需要像使用一個Redis的方式去操作這個叢集，這種方案将大大降低開發人員的使用成本，開發人員可以隻需要關注業務邏輯即可，不需要關心Redis的資源問題。

多個節點組成的叢集，如何讓開發人員像操作一個Redis時那樣來使用呢？這就涉及到多個節點是如何組織起來提供服務的，一般我們會在用戶端和服務端中間增加一個代理層，用戶端隻需要操作這個代理層，代理層實作了具體的請求轉發規則，然後轉發請求到後面的多個節點上，是以這種方式也叫做中心化方式的叢集方案，Codis就是以這種方式實作的叢集化方案。

Codis是由國人前豌豆莢大神開發的，采用中心化方式的叢集方案。因為需要代理層Proxy來進行所有請求的轉發，是以對Proxy的性能要求很高，Codis采用Go語言開發，相容了開發效率和性能。

Codis包含了多個元件：

codis-proxy：主要負責對請求的讀寫進行轉發

codis-dashbaord：統一的控制中心，整合了資料轉發規則、故障自動恢複、資料線上遷移、節點擴容縮容、自動化運維API等功能

codis-group：基于Redis 3.2.8版本二次開發的Redis Server，增加了異步資料遷移功能

codis-fe：管理多個叢集的UI界面

可見Codis的元件還是挺多的，它的功能非常全，除了請求轉發功能之外，還實作了線上資料遷移、節點擴容縮容、故障自動恢複等功能。

Codis的Proxy就是負責請求轉發的元件，它内部維護了請求轉發的具體規則，Codis把整個叢集劃分為1024個槽位，在處理讀寫請求時，采用crc32Hash算法計算key的Hash值，然後再根據Hash值對1024個槽位取模，最終找到具體的Redis節點。

Codis最大的特點就是可以線上擴容，在擴容期間不影響用戶端的通路，也就是不需要停機。這對業務使用方是極大的便利，當叢集性能不夠時，就可以動态增加節點來提升叢集的性能。

為了實作線上擴容，保證資料在遷移過程中還有可靠的性能，Codis針對Redis進行了修改，增加了針對異步遷移資料相關指令，它基于Redis 3.2.8進行開發，上層配合Dashboard和Proxy元件，完成對業務無損的資料遷移和擴容功能。

是以，要想使用Codis，必須使用它内置的Redis，這也就意味着Codis中的Redis是否能跟上官方最新版的功能特性，可能無法得到保障，這取決于Codis的維護方，目前Codis已經不再維護，是以使用Codis時隻能使用3.2.8版的Redis，這是一個痛點。

另外，由于叢集化都需要部署多個節點，是以操作叢集并不能完全像操作單個Redis一樣實作所有功能，主要是對于操作多個節點可能産生問題的指令進行了禁用或限制，具體可參考Codis不支援的指令清單。

但這不影響它是一個優秀的叢集化方案，由于我司使用Redis叢集方案較早，那時Redis Cluster還不夠成熟，是以我司使用的Redis叢集方案就是Codis。

目前我的工作主要是圍繞Codis展開的，我們公司對Codis進行了定制開發，還對Redis進行了一些改造，讓Codis支援了跨多個資料中心的資料同步。

Twemproxy是由Twitter開源的叢集化方案，它既可以做Redis Proxy，還可以做Memcached Proxy。

它的功能比較單一，隻實作了請求路由轉發，沒有像Codis那麼全面有線上擴容的功能，它解決的重點就是把用戶端分片的邏輯統一放到了Proxy層而已，其他功能沒有做任何處理。

Tweproxy推出的時間最久，在早期沒有好的服務端分片叢集方案時，應用範圍很廣，而且性能也極其穩定。

但它的痛點就是無法線上擴容、縮容，這就導緻運維非常不友善，而且也沒有友好的運維UI可以使用。Codis就是因為在這種背景下才衍生出來的。

采用中間加一層Proxy的中心化模式時，這就對Proxy的要求很高，因為它一旦出現故障，那麼操作這個Proxy的所有用戶端都無法處理，要想實作Proxy的高可用，還需要另外的機制來實作，例如Keepalive。

而且增加一層Proxy進行轉發，必然會有一定的性能損耗，那麼除了用戶端分片和上面提到的中心化的方案之外，還有比較好的解決方案麼？

Redis官方推出的Redis Cluster另辟蹊徑，它沒有采用中心化模式的Proxy方案，而是把請求轉發邏輯一部分放在用戶端，一部分放在了服務端，它們之間互相配合完成請求的處理。

Redis Cluster是在Redis 3.0推出的，早起的Redis Cluster由于沒有經過嚴格的測試和生産驗證，是以并沒有廣泛推廣開來。也正是在這樣的背景下，業界衍生了出了上面所說的中心化叢集方案：Codis和Tweproxy。

但随着Redis的版本疊代，Redis官方的Cluster也越來越穩定，更多人開始采用官方的叢集化方案。也正是因為它是官方推出的，是以它的持續維護性可以得到保障，這就比那些第三方的開源方案更有優勢。

Redis Cluster沒有了中間的Proxy代理層，那麼是如何進行請求的轉發呢？

Redis把請求轉發的邏輯放在了Smart Client中，要想使用Redis Cluster，必須更新Client SDK，這個SDK中内置了請求轉發的邏輯，是以業務開發人員同樣不需要自己編寫轉發規則，Redis Cluster采用16384個槽位進行路由規則的轉發。

沒有了Proxy層進行轉發，用戶端可以直接操作對應的Redis節點，這樣就少了Proxy層轉發的性能損耗。

Redis Cluster也提供了線上資料遷移、節點擴容縮容等功能，内部還内置了哨兵完成故障自動恢複功能，可見它是一個內建所有功能于一體的Cluster。是以它在部署時非常簡單，不需要部署過多的元件，對于運維極其友好。

Redis Cluster在節點資料遷移、擴容縮容時，對于用戶端的請求處理也做了相應的處理。當用戶端通路的資料正好在遷移過程中時，服務端與用戶端制定了一些協定，來告知用戶端去正确的節點上通路，幫助用戶端訂正自己的路由規則。

雖然Redis Cluster提供了線上資料遷移的功能，但它的遷移性能并不高，遷移過程中遇到大key時還有可能長時間阻塞遷移的兩個節點，這個功能相較于Codis來說，Codis資料遷移性能更好。

現在越來越多的公司開始采用Redis Cluster，有能力的公司還在它的基礎上進行了二次開發和定制，來解決Redis Cluster存在的一些問題，我們期待Redis Cluster未來有更好的發展。

總結

比較完了這些叢集化方案，下面我們來總結一下。

Redis 的 3 種叢集方案對比，寫得非常好！

繼續閱讀

C++ 第十五周報告1--《冒泡法排序》

淺談企業活動中進行資料分析的重要性

Shell程式設計——sort排序、uniq忽略重複、tr替換壓縮删除、cut指定删除字段、正規表達式元字元sort 指令uniq 指令tr 指令cut 指令正規表達式

筆試面試題目：滑動視窗(二)

Linxu常用指令技巧彙總

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

資料結構與算法（27）——排序（二）

nginx 安裝錯誤資訊解決

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希