天天看点

Redis:复制,第2部分——主从复制和Redis哨兵介绍基本主从复制Redis哨兵相关链接

目录

介绍

基本主从复制

Redis主机配置

Redis从机配置

改变从=>主角色

Redis哨兵

运行哨兵

Redis 哨兵自动故障转移

相关链接

第一部分—— Redis:复制,第1部分——概述 复制与分片、哨兵与集群、Redis拓扑。

介绍

当我们决定摆脱memcached时,整个故事就开始了。

目前,我们已经在我们的后端服务器上运行memcahced和Redis。

并且memcached,Redis实例作为独立应用程序运行,即它们没有连接任何类型的复制,这导致了一个问题:

  • 我们有三个后端主机,它们托管在AWS应用负载平衡器后面
  • ALB 启用了Sticky Sessions,但它正在使用我们的移动应用程序(iOS / Android)忽略的cookie
  • 当客户端向后端发出请求时——有时,它可以获取已在Redis中的另一个后端主机上删除/更新的缓存数据或 memcached

我们有这个方案,因为我们从一个旧的基础设施迁移我们的后端应用程序,其中只使用了一个主机并且仍然没有时间更新它,尽管它在我们的主机上很长一段时间了。

目前,为了解决这些问题,我们在后端有一堆“黑客”,它会进行额外的检查以确保数据是最新的,现在为了摆脱它们,我们决定:

  1. 完全摆脱memcached,因为Redis可以用于现在memcached使用的功能
  2. 在所有主机上配置Redis复制

这样的设置将在下面的内容中描述。

第一个示例——使用基本的主从复制和第二个示例——哨兵设置和配置。

这里将使用Debian 9的AWS EC2实例。

要与Redis主机一起使用,将使用三个域名——redis-0.setevoy.org.ua用于主服务器,redis-1.setevoy.org.ua和redis-2.setevoy.org.ua用于其两个从服务器。

最小设置中的从机只能是一个,但这里的第二个例子将是哨兵——让我们从一开始就有三个。

基本主从复制

这样,从机将成为主机的只读从机,保留将添加到主机中的相同数据。

主机将向其从机发送所有数据更新——新密钥到期等。

如果主机和从机之间的链路断开——从机将尝试重新连接到主机并进行部分同步以从先前同步被中断的位置更新数据。

如果不能进行这种部分同步——从机将要求主机进行完全同步,并且主机将执行其数据完整快照,该快照将被发送到该从机,此后,将恢复通常的同步。

这里有几点需要注意:

  • 一个主机可以拥有多个从机
  • 从机可以接受来自其他从机的连接,使得复制节点的“级联”——顶部的主机,中间的从机和底部的从机
  • 强烈建议在主服务器上启用数据持久性以避免数据丢失——请参阅主服务器关闭持久性时的复制安全性
  • 默认情况下,从机将以只读模式工作,请参阅只读从机

Redis主机配置

安装Redis:

[email protected]:/home/admin# apt -y install redis-server
           

编辑/etc/redis/redis.conf并在bind集接口中监听:

...
bind 0.0.0.0
...
           

您可以在此处指定以空格分隔的多个IP:.

...
bind 127.0.0.1 18.194.229.23
...
           

其他有价值的选择:

  • port 6379——足够清楚但记住它
  • slave-read-only yes——从机将以只读模式工作,不会影响主机
  • requirepass foobared ——主机授权的密码
  • appendonly yes和appendfilename "appendonly.aof"——减少数据丢失的机会,详见Redis的持久性

重启服务:

[email protected]:/home/admin# systemctl restart redis
           

使用-a密码检查:

[email protected]:/home/admin# redis-cli -a foobared ping
PONG
           

检查数据复制状态:

[email protected]:/home/admin# redis-cli -a foobared info replication
Replication
role:master
connected_slaves:0
master_repl_offset:0
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
           

添加新数据:

[email protected]:/home/admin# redis-cli -a foobared set test 'test'

OK
           

返回数据:

[email protected]:/home/admin# redis-cli -a foobared get test

"test"
           

好的——这里一切正常。

Redis从机配置

在左侧的两台主机上,进行从机配置。

两者都是一样的——只需重复一遍即可。

安装Redis:

[email protected]:/home/admin# apt -y install redis-server
           

编辑/etc/redis/redis.conf:

...
slaveof redis-0.setevoy.org.ua 6379
...
masterauth foobared
...
requirepass foobared
...
           

这里:

  • slaveof——设置主服务器的主机和端口
  • masterauth——主机的认证
  • requirepass——在此从机上验证

重启服务:

[email protected]:/home/admin# systemctl restart redis
           

检查其状态:

[email protected]:/home/admin# redis-cli -a foobared info replication

Replication

role:slave

master_host:redis-0.setevoy.org.ua

master_port:6379

master_link_status:up

master_last_io_seconds_ago:5

master_sync_in_progress:0

...
           

检查日志:

[email protected]:/home/admin# tail -f /var/log/redis/redis-server.log

16961:S 29 Mar 10:54:36.263 * Connecting to MASTER redis-0.setevoy.org.ua:6379

16961:S 29 Mar 10:54:36.308 * MASTER <-> SLAVE sync started

16961:S 29 Mar 10:54:36.309 * Non blocking connect for SYNC fired the event.

16961:S 29 Mar 10:54:36.309 * Master replied to PING, replication can continue...

16961:S 29 Mar 10:54:36.310 * Partial resynchronization not possible (no cached master)

16961:S 29 Mar 10:54:36.311 * Full resync from master: 93585eeb7e32c0550c35f8d4935c9a18c4177ab9:1

16961:S 29 Mar 10:54:36.383 * MASTER <-> SLAVE sync: receiving 92 bytes from master

16961:S 29 Mar 10:54:36.383 * MASTER <-> SLAVE sync: Flushing old data

16961:S 29 Mar 10:54:36.383 * MASTER <-> SLAVE sync: Loading DB in memory

16961:S 29 Mar 10:54:36.383 * MASTER <-> SLAVE sync: Finished with success
           

建立连接到主机,同步完成——好吧,检查数据:

[email protected]:/home/admin# redis-cli -a foobared get test

"test"
           

数据存在——这里所有工作都正常运行。

改变从=>主角色

如果主机将关闭——您必须切换其中一个从机成为新的主机。

如果您尝试在当前从机上添加任何数据——由于从机处于只读模式,Redis将引发错误:

...
slave-read-only yes
...
           

尝试添加一些东西:

[email protected]:/home/admin# redis-cli -a foobared set test2 'test2'

(error) READONLY You can't write against a read only slave.
           

现在连接到从机:

[email protected]:/home/admin# redis-cli
           

授权:

127.0.0.1:6379> auth foobared

OK
           

禁用slave-role:

127.0.0.1:6379> slaveof no one

OK
           

立即检查其状态:

127.0.0.1:6379> info replication

Replication

role:master

connected_slaves:0

master_repl_offset:1989

repl_backlog_active:0

repl_backlog_size:1048576
           

再次添加新密钥:

127.0.0.1:6379> set test2 'test2'

OK
           

得到返回值:

127.0.0.1:6379> get test2

"test2"
           

请记住,我们直接在Redis节点中进行了这些更改——重新启动后,它将再次成为从属服务器,因为它仍然在其/etc/redis/redis.conf文件中使用slaveof参数进行设置。

Redis哨兵

现在让我们将哨兵添加到我们的复制中,它将监视Redis节点并自动执行角色切换。

整个计划将是下一个:

Redis:复制,第2部分——主从复制和Redis哨兵介绍基本主从复制Redis哨兵相关链接

这里:

  • M1 =主机
  • R1 =复制 1 /从机1
  • R2 =复制 2 /从机2
  • S1 =哨兵 1
  • S2 =哨兵 2
  • S3 =哨兵 3

M1和S1——将对应redis-0,R 1和S2——对应redis -1,R 2和S3——对应redis-2。

运行哨兵

要运行哨兵守护程序,redis-server只能使用单独的配置——/etc/redis/哨兵.conf。

首先,让我们在Redis Master主机上创建这样的配置文件:

sentinel monitor redis-test redis-0.setevoy.org.ua 6379 2
sentinel down-after-milliseconds redis-test 6001
sentinel failover-timeout redis-test 60000
sentinel parallel-syncs redis-test 1
bind 0.0.0.0
sentinel auth-pass redis-test foobared
           

这里:

  • Monitor——要监视的主机地址,2是哨兵的实例编号来决定
  • down-after-milliseconds——主机将被视为无序的时间
  • failover-timeout——更改从机=> 主机角色后等待的时间
  • parallel-syncs——主机更改后同步从机的数目

运行:

[email protected]:/home/admin# redis-server /etc/redis/sentinel.conf --sentinel

...

10447:X 29 Mar 14:15:53.193 # WARNING: The TCP backlog setting of 511 cannot be enforced 
because /proc/sys/net/core/somaxconn is set to the lower value of 128.

10447:X 29 Mar 14:15:53.195 # Sentinel ID is e9fb72c8edb8ec2028e6ce820b9e72e56e07cf1e

10447:X 29 Mar 14:15:53.195 # +monitor master redis-test 35.158.154.25 6379 quorum 2

10447:X 29 Mar 14:15:53.196 * +slave slave 3.121.223.95:6379 3.121.223.95 6379 
@ redis-test 35.158.154.25 6379

10447:X 29 Mar 14:16:43.402 * +slave slave 18.194.45.17:6379 18.194.45.17 6379 
@ redis-test 35.158.154.25 6379
           

使用26379端口检查哨兵的状态:

[email protected]:/home/admin# redis-cli -p 26379 info sentinel

Sentinel

sentinel_masters:1

sentinel_tilt:0

sentinel_running_scripts:0

sentinel_scripts_queue_length:0

sentinel_simulate_failure_flags:0

master0:name=redis-test,status=ok,address=35.158.154.25:6379,slaves=2,sentinels=1
           

这里:

  • master0:name=redis-test,status=ok——主机是UP
  • slaves=2——它有两个从机
  • 哨兵s=1——目前只运行一个哨兵实例

您可以在这里获得一些基本信息,例如——主机的IP:

[email protected]:/home/admin# redis-cli -p 26379 sentinel get-master-addr-by-name redis-test

1) "35.158.154.25"

2) "6379"
           

现在使用与我们在主机和哨兵日志中执行的配置相同的配置重复两个从机上的哨兵启动,您必须看到连接的新实例:

...

10447:X 29 Mar 14:18:40.437 * +sentinel sentinel fdc750c7d6388a6142d9e27b68172f5846e75d8c 
172.31.36.239 26379 @ redis-test 35.158.154.25 6379

10447:X 29 Mar 14:18:42.725 * +sentinel sentinel ecddb26cd27c9a17c4251078c977761faa7a3250 
172.31.35.218 26379 @ redis-test 35.158.154.25 6379

...
           

再次检查状态:

[email protected]:/home/admin# redis-cli -p 26379 info sentinel

Sentinel

sentinel_masters:1

sentinel_tilt:0

sentinel_running_scripts:0

sentinel_scripts_queue_length:0

sentinel_simulate_failure_flags:0

master0:name=redis-test,status=ok,address=18.194.229.23:6379,slaves=2,sentinels=3
           

哨兵s=3——好的。

此外,哨兵将在需要时执行自己的设置更新:

[email protected]:/home/admin# cat /etc/redis/sentinel.conf

sentinel myid fdc750c7d6388a6142d9e27b68172f5846e75d8c

sentinel monitor redis-test 35.158.154.25 6379 2

sentinel down-after-milliseconds redis-test 6001

bind 0.0.0.0

sentinel failover-timeout redis-test 60000

Generated by CONFIG REWRITE

port 26379

dir "/home/admin"

sentinel auth-pass redis-test foobared

sentinel config-epoch redis-test 0

sentinel leader-epoch redis-test 0

sentinel known-slave redis-test 18.194.45.17 6379

sentinel known-slave redis-test 3.121.223.95 6379

sentinel known-sentinel redis-test 172.31.35.218 26379 ecddb26cd27c9a17c4251078c977761faa7a3250

sentinel known-sentinel redis-test 172.31.47.184 26379 e9fb72c8edb8ec2028e6ce820b9e72e56e07cf1e

sentinel current-epoch 0
           

这是添加的哨兵myid  fdc750c7d6388a6142d9e27b68172f5846e75d8c以及#CONFIG REWRITE生成的整个块。

Redis 哨兵自动故障转移

现在让我们来看看如果主机会失败将会发生什么。

您可以通过调用kill -9或使用redis-cli和以及DEBUG以秒为单位发送命令来手动执行此操作,以使主机“关闭”或通过发送信号来杀死主机。

[email protected]:/home/admin# redis-cli -a foobared DEBUG sleep 30
           

哨兵登录主机:

...

10447:X 29 Mar 14:24:56.549 # +sdown master redis-test 35.158.154.25 6379

10447:X 29 Mar 14:24:56.614 # +new-epoch 1

10447:X 29 Mar 14:24:56.615 # +vote-for-leader ecddb26cd27c9a17c4251078c977761faa7a3250 1

10447:X 29 Mar 14:24:56.649 # +odown master redis-test 35.158.154.25 6379 #quorum 3/2

10447:X 29 Mar 14:24:56.649 # Next failover delay: 
I will not start a failover before Fri Mar 29 14:26:57 2019

10447:X 29 Mar 14:24:57.686 # +config-update-from sentinel 
ecddb26cd27c9a17c4251078c977761faa7a3250 172.31.35.218 26379 @ redis-test 35.158.154.25 6379

10447:X 29 Mar 14:24:57.686 # +switch-master redis-test 35.158.154.25 6379 3.121.223.95 6379

10447:X 29 Mar 14:24:57.686 * +slave slave 18.194.45.17:6379 18.194.45.17 6379 
@ redis-test 3.121.223.95 6379

10447:X 29 Mar 14:24:57.686 * +slave slave 35.158.154.25:6379 35.158.154.25 6379 
@ redis-test 3.121.223.95 6379

10447:X 29 Mar 14:25:03.724 # +sdown slave 35.158.154.25:6379 35.158.154.25 6379 
@ redis-test 3.121.223.95 6379

...
           

目前,我们对这两行感兴趣:

...

10384:X 29 Mar 14:24:57.686 # +config-update-from sentinel 
ecddb26cd27c9a17c4251078c977761faa7a3250 172.31.35.218 26379 @ redis-test 35.158.154.25 6379

10384:X 29 Mar 14:24:57.686 # +switch-master redis-test 35.158.154.25 6379 3.121.223.95 6379

...
           

哨兵执行从机到主机的重新配置。

35.158.154.25——现在已经死了的老主机,3.121.223.95是从从机中选出的新主机——它在redis-1主机上运行。

尝试在此处添加数据:

[email protected]:/home/admin# redis-cli -a foobared set test3 'test3'

OK
           

当对现在成为从机的旧主机进行类似的尝试时,将导致错误:

[email protected]:/home/admin# redis-cli -a foobared set test4 'test4'

(error) READONLY You can't write against a read only slave.
           

让我们杀死一个节点,看看哨兵现在会做什么:

[email protected]:/home/admin# redis-cli -a foobared DEBUG SEGFAULT

Error: Server closed the connection
           

日志:

...

10447:X 29 Mar 14:26:21.897 * +reboot slave 35.158.154.25:6379 35.158.154.25 6379 
@ redis-test 3.121.223.95 6379
           

嗯——哨兵刚刚重启了那个节点

哨兵命令

命令 描述
sentinel masters 列出所有主机及其状态
sentinel master 一个主机的身份
sentinel slaves 列出所有从机及其状态
sentinel sentinels 列出所有哨兵实例及其状态
sentinel failover 手动运行故障转移
sentinel flushconfig 强制哨兵重写其在磁盘上的配置
sentinel monitor 添加一个新的主机
sentinel remove 从被检测中移除主机

相关链接

  • Redis复制
  • Примерфайланастроек哨兵
  • Redis哨兵——高可用性:从DEV到PROD需要了解的所有内容:完整指南
  • Redis哨兵:使您的数据集具有高可用性
  • 如何运行Redis哨兵

原文地址:https://www.codeproject.com/Articles/1328499/Redis-Replication-Part-2-Master-Slave-Replication