天天看點

redis系列07--redis哨兵叢集搭建

目錄

一、搭建

1、哨兵的配置檔案

2、在eshop-cache03上再部署一個redis

2、正式的配置

3、啟動哨兵程序

4、檢查哨兵狀态

二、操作

1、哨兵節點的增加和删除

2、slave的永久下線

3、slave切換為Master的優先級

4、基于哨兵叢集架構下的安全認證

5、容災演練

6、哨兵的生産環境部署

一、搭建

1、哨兵的配置檔案

sentinel.conf

最小的配置

每一個哨兵都可以去監控多個maser-slaves的主從架構

因為可能你的公司裡,為不同的項目,部署了多個master-slaves的redis主從叢集

相同的一套哨兵叢集,就可以去監控不同的多個redis主從叢集

你自己給每個redis主從叢集配置設定一個邏輯的名稱

sentinel monitor mymaster 127.0.0.1 6379 2

sentinel down-after-milliseconds mymaster 60000

sentinel failover-timeout mymaster 180000

sentinel parallel-syncs mymaster 1

sentinel monitor resque 192.168.1.3 6380 4

sentinel down-after-milliseconds resque 10000

sentinel failover-timeout resque 180000

sentinel parallel-syncs resque 5

sentinel monitor mymaster 127.0.0.1 6379 

類似這種配置,來指定對一個master的監控,給監控的master指定的一個名稱,因為後面分布式叢集架構裡會講解,可以配置多個master做資料拆分

sentinel down-after-milliseconds mymaster 60000

sentinel failover-timeout mymaster 180000

sentinel parallel-syncs mymaster 1

上面的三個配置,都是針對某個監控的master配置的,給其指定上面配置設定的名稱即可

上面這段配置,就監控了兩個master node

這是最小的哨兵配置,如果發生了master-slave故障轉移,或者新的哨兵程序加入哨兵叢集,那麼哨兵會自動更新自己的配置檔案

sentinel monitor master-group-name hostname port quorum

quorum的解釋如下:

(1)至少多少個哨兵要一緻同意,master程序挂掉了,或者slave程序挂掉了,或者要啟動一個故障轉移操作

(2)quorum是用來識别故障的,真正執行故障轉移的時候,還是要在哨兵叢集執行選舉,選舉一個哨兵程序出來執行故障轉移操作

(3)假設有5個哨兵,quorum設定了2,那麼如果5個哨兵中的2個都認為master挂掉了; 2個哨兵中的一個就會做一個選舉,選舉一個哨兵出來,執行故障轉移; 如果5個哨兵中有3個哨兵都是運作的,那麼故障轉移就會被允許執行

down-after-milliseconds,超過多少毫秒跟一個redis執行個體斷了連接配接,哨兵就可能認為這個redis執行個體挂了

parallel-syncs,新的master别切換之後,同時有多少個slave被切換到去連接配接新master,重新做同步,數字越低,花費的時間越多

假設你的redis是1個master,4個slave

然後master當機了,4個slave中有1個切換成了master,剩下3個slave就要挂到新的master上面去

這個時候,如果parallel-syncs是1,那麼3個slave,一個一個地挂接到新的master上面去,1個挂接完,而且從新的master sync完資料之後,再挂接下一個

如果parallel-syncs是3,那麼一次性就會把所有slave挂接到新的master上去

failover-timeout,執行故障轉移的timeout逾時時長

2、在eshop-cache03上再部署一個redis

隻要安裝redis就可以了,不需要去部署redis執行個體的啟動

wget http://downloads.sourceforge.net/tcl/tcl8.6.1-src.tar.gz

tar -xzvf tcl8.6.1-src.tar.gz

cd  /usr/local/tcl8.6.1/unix/

./configure  

make && make install

使用redis-3.2.8.tar.gz(截止2017年4月的最新穩定版)

tar -zxvf redis-3.2.8.tar.gz

cd redis-3.2.8

make && make test

make install

2、正式的配置

哨兵預設用26379端口,預設不能跟其他機器在指定端口連通,隻能在本地通路

mkdir /etc/sentinal

mkdir -p /var/sentinal/5000

/etc/sentinel/5000.conf

port 5000

bind 192.168.31.187

dir /var/sentinal/5000

sentinel monitor mymaster 192.168.31.187 6379 2

sentinel down-after-milliseconds mymaster 30000

sentinel failover-timeout mymaster 60000

sentinel parallel-syncs mymaster 1

#加上reids密碼

sentinel auth-pass mymaster 123123

protected-mode no

port 5000

bind 192.168.31.19

dir /var/sentinal/5000

sentinel monitor mymaster 192.168.31.187 6379 2

sentinel down-after-milliseconds mymaster 30000

sentinel failover-timeout mymaster 60000

sentinel parallel-syncs mymaster 1

port 5000

bind 192.168.31.227

dir /var/sentinal/5000

sentinel monitor mymaster 192.168.31.187 6379 2

sentinel down-after-milliseconds mymaster 30000

sentinel failover-timeout mymaster 60000

sentinel parallel-syncs mymaster 1

3、啟動哨兵程序

在eshop-cache01、eshop-cache02、eshop-cache03三台機器上,分别啟動三個哨兵程序,組成一個叢集,觀察一下日志的輸出

redis-sentinel /etc/sentinal/5000.conf

redis-server /etc/sentinal/5000.conf --sentinel

日志裡會顯示出來,每個哨兵都能去監控到對應的redis master,并能夠自動發現對應的slave

哨兵之間,互相會自動進行發現,用的就是之前說的pub/sub,消息釋出和訂閱channel消息系統和機制

4、檢查哨兵狀态

redis-cli -h 192.168.31.187 -p 5000

sentinel master mymaster

SENTINEL slaves mymaster

SENTINEL sentinels mymaster

SENTINEL get-master-addr-by-name mymaster

二、操作

1、哨兵節點的增加和删除

增加sentinal,會自動發現

删除sentinal的步驟

(1)停止sentinal程序

(2)SENTINEL RESET *,在所有sentinal上執行,清理所有的master狀态

(3)SENTINEL MASTER mastername,在所有sentinal上執行,檢視所有sentinal對數量是否達成了一緻

2、slave的永久下線

讓master摘除某個已經下線的slave:SENTINEL RESET mastername,在所有的哨兵上面執行

3、slave切換為Master的優先級

slave->master選舉優先級:slave-priority,值越小優先級越高

4、基于哨兵叢集架構下的安全認證

每個slave都有可能切換成master,是以每個執行個體都要配置兩個指令

master上啟用安全認證,requirepass

master連接配接密碼,masterauth

sentinal,sentinel auth-pass <master-group-name> <pass>

5、容災演練

通過哨兵看一下目前的master:SENTINEL get-master-addr-by-name mymaster

把master節點kill -9掉,pid檔案也删除掉

檢視sentinal的日志,是否出現+sdown字樣,識别出了master的當機問題; 然後出現+odown字樣,就是指定的quorum哨兵數量,都認為master當機了

(1)三個哨兵程序都認為master是sdown了

(2)超過quorum指定的哨兵程序都認為sdown之後,就變為odown

(3)哨兵1是被選舉為要執行後續的主備切換的那個哨兵

(4)哨兵1去新的master(slave)擷取了一個新的config version

(5)嘗試執行failover

(6)投票選舉出一個slave區切換成master,每個哨兵都會執行一次投票

(7)讓salve,slaveof noone,不讓它去做任何節點的slave了; 把slave提拔成master; 舊的master認為不再是master了

(8)哨兵就自動認為之前的187:6379變成了slave了,19:6379變成了master了

(9)哨兵去探查了一下187:6379這個salve的狀态,認為它sdown了

所有哨兵選舉出了一個,來執行主備切換操作

如果哨兵的majority都存活着,那麼就會執行主備切換操作

再通過哨兵看一下master:SENTINEL get-master-addr-by-name mymaster

嘗試連接配接一下新的master

故障恢複,再将舊的master重新啟動,檢視是否被哨兵自動切換成slave節點

(1)手動殺掉master

(2)哨兵能否執行主備切換,将slave切換為master

(3)哨兵完成主備切換後,新的master能否使用

(4)故障恢複,将舊的master重新啟動

(5)哨兵能否自動将舊的master變為slave,挂接到新的master上面去,而且也是可以使用的

6、哨兵的生産環境部署

daemonize yes

logfile /var/log/sentinal/5000/sentinal.log

mkdir -p /var/log/sentinal/5000