redis主从复制与哨兵模式

一个Redis服务可以有多个复制品，这个Redis服务称为Master，其它复制品称为Slaves；Master会一直将自己的数据更新同步到Slaves，保持主从一致。

1. 主从配置

有两种方式可以配置redis的主从复制，一是在启动时，二是在启动后：

①在服务启动时，就指定它为一个从服务器（这种配置方式是临时的）

命令：redis-server --slaveof <master-ip> <master-port>

redis主从复制与哨兵模式

或者，配置redis.conf文件，开启slaveof配置（这种配置方式是永久的）

redis主从复制与哨兵模式

②在服务启动后，将它的状态由master改为slave，命令：

127.0.0.1:6380> slaveof 127.0.0.1 6379，将服务器状态转换成slave

127.0.0.1:6380> slaveof no one，将服务器状态重新转换成master

（这种方式也是临时的，在服务器关闭以后，就不在生效）

其它配置：

1、如果master服务器开启了身份认证，即配置了requirepass属性（比如requirepass root）表示连接到master服务器需要密码root；则slave服务器需要配置masterauth属性（即：masterauth root）否则master会拒绝slave的连接。

2、slave服务器在一般情况下，都要配置成只读模式，即配置slave-read-only属性（即：slave-read-only no，从redis2.6开始此项就默认为no）。这样master就负责写，其它从服务器slave就负责读。如果slave也可以写，它并不会把自己的数据同步到master上，导致主从数据不一致。

2.主从拓扑

redis有3种主从服务器的搭建拓扑：

①一主一从，用于master故障转移slave。使用场景：master的“写”命令频繁并且需要持久化，可以只在slave开启AOF（master就不需要开启），既可以保证数据安全性，也避免持久化对master的影响。

redis主从复制与哨兵模式

②一主多从，适用于“读”命令较多的场景，配置多个slave来分担master的读压力，但是，slave越多，master同步数据到slave的次数也会增多，可能会影响带宽

redis主从复制与哨兵模式

③树状主从，用来解决第②种一主多从的问题（master同步数据到slave的压力过大），master同步修改的命令给从节点B，再由从节点B把修改命令同步给C和E。这种拓扑的配置步骤：

①配置主服务器master-A；

②配置从服务器slave-B，它的主服务器是master-A；

③配置从服务器slave-C，它的主服务器是slave-B（说白了，就是从服务器是另一个从服务器的“主服务器”）这样master-A就不用直接把数据同步给slave-C，A只需要把数据同步给B，再由B同步给C，减轻主服务器master-A的数据同步压力！

redis主从复制与哨兵模式

3.主从同步策略

当将一个redis服务配置为另一个redis服务的从服务器时，为了保证主从数据同步，从服务器需要复制主服务器的数据。这个过程有两种情况：一种是刚刚配置主从关系时，此时的复制操作称为“全量同步”；另一种是主从配置以后，主服务器的修改都会同步到从服务器上，此时的复制操作称为“增量同步”

3.1 全量同步

全量同步发生在主从复制刚配置好的阶段，此时主服务器上的数据需要全部同步到从服务器上，会发生以下步骤：

redis主从复制与哨兵模式

①slave连接到master上，并发送SYNC命令

②master收到SYNC命令后，执行BGSAVE生成RDB快照，在快照生成后，master向所有slave发送RDB快照，并且master还会缓冲区记录期间的写命令

③slave收到RDB快照，清空自己的数据库，载入RDB快照

④master发送完快照后，开始发送②步记录在缓冲区的写命令

⑤slave接收并执行master的写命令。至此，主从数据基本同步

3.2 增量同步

经过全量同步后，主从服务器的数据基本一致，但主服务器master的数据并不是一成不变的。当执行写命令后，master会把这条命令发送给slave，slave接收并执行这条写命令，继续保持主从数据一致，这个过程就是增量同步。

4.主从同步原理

当主从服务器在执行数据同步时，redis2.8版本之前，从服务器是发送SYNC命令给主服务器；而当redis2.8起，从服务器是发送PSYNC命令给主服务器。

4.1 SYNC

SYNC命令是非常消耗性能的，redis服务器每次执行SYNC命令，都要先生成RDB文件，再发送给从服务器，然后从服务器再来执行这个RDB文件，整个过程不仅消耗主服务器的CPU和网络资源，且从服务器在载入RDB文件时，也会因为阻塞而不能处理请求。但问题远没有那么简单，SYNC命令被抛弃的原因是：当master和slave在增量同步时，由于各种原因slave断开连接，然后slave会一直自动重连master，一段时间后，主从服务器恢复连接，但是此时的主从数据已经不同步了，slave会发送SYNC命令重新请求同步数据。但其实slave缺失的仅仅是master掉线期间更新的数据，但是却要同步master所有的数据，相当于重新执行一遍SYNC，这是十分低效且浪费资源的

4.2 PSYNC

redis为了解决SYNC效率低的问题，开始在2.8版本以后，使用PSYNC代替SYNC命令。PSNYC命令具有“完整重同步”和“部分重同步”两种模式，“完整重同步”适用于全量同步，这一点与SYNC命令一样；“部分重同步”则专门用于处理主从服务器断开连接后重同步的情况，把断线期间，master执行的命令同步到slave上。那么master在收到PSYNC命令后是怎么判断要对slave使用“完整重同步”还是“部分重同步”？这就涉及到PSYNC命令的原理，PSYNC的部分重同步模式由以下3个部分组成：

①主、从服务器各自的复制偏移量

②主服务器的复制积压缓冲区

③服务器的运行ID

4.2.1 复制偏移量

master和slave都各自维护一个复制偏移量，master每次同步给slave服务器N个字节的数据时，就把自己的复制偏移量+N；同理，slave接收到master服务器的N个字节的数据，就把自己的复制偏移量+N；通过这个复制偏移量，就可以知道主从服务器之间是否处于数据一致状态。

redis主从复制与哨兵模式

4.2.2 复制积压缓冲区

复制积压缓冲区是由master维护的一个固定长度的先进先出队列，默认为1MB。当复制积压缓冲区满的时候，仍有新元素进来，则最先入队的元素会被弹出，而新元素被放到队尾。master在进行数据同步时，不仅会把命令发送给从服务器，还会把命令保存到复制积压缓冲区里，且复制积压缓冲区会把命令的每个字节记录相应的复制偏移量：

redis主从复制与哨兵模式

所以当slave重新连接上master时，会将自己的复制偏移量通过PSYNC发送给master。master判断：若slave发过来的复制偏移量+1后的数据仍在复制积压缓冲区内，就执行“部分重同步”操作，反之执行“完整重同步”。由此可见，复制积压缓冲区是非常重要的，设置太大和太小都不能发挥PSYNC的正常功能。一般是根据公式：

缓冲区大小 = second * write_size_per_second

second：从服务器断线后重新连接上主服务器所需的平均时间（以秒计算）

write_size_per_second：是主服务器平均每秒产生的写命令数据量（协议格式的写命令的长度总和）；

例如：

如果主服务器平均每秒产生1 MB的写数据，而从服务器断线之后平均要5秒才能重新连接上主服务器，那么复制积压缓冲区的大小就不能低于5MB！

4.2.3 服务运行ID

每个redis服务器，不论是master还是slave，都会有自己的运行ID，该ID会在服务启动时自动生成，为40个随机的十六进制字符。除了复制偏移量和复制积压缓冲区，要实现PSYNC命令的“部分重同步”还需要用到这个服务运行ID。

当主从服务器第一次交互，即全量同步时，master会把自己的运行ID发送给slave，slave保存该运行ID；当slave掉线重连，需要重新更新数据，slave会通过PSYNC命令将之前保存的master运行ID一并发送给当前重连的master；若master发现这个运行ID跟自己的运行ID一样，它就会对slave执行“部分重同步”操作（当然还需要判断复制偏移量和复制积压缓冲区的情况）；否则，一旦slave发送的运行ID跟自己的运行ID不一样，说明slave之前连接的主服务器不是自己，那么它就会对slave执行“完整重同步”操作。

个人理解：服务运行ID的判断优先于复制偏移量和复制积压缓冲区！

5.哨兵模式

单单的主从复制，在发生故障时，没有办法自行故障转移。所以，在实际生产运用中，主从复制往往和哨兵模式结合在一起，使用哨兵模式Sentinel管理多个redis服务实例。Redis Sentinel是一个分布式系统，可以在一个架构中运行多个Sentinel进程，编译后产生redis-sentinel程序文件。

5.1 sentinel工作流程

一个Sentinel可以监控多个master以及它们对应的slave，如下图所示：

redis主从复制与哨兵模式

哨兵Sentinel是分布式架构，是为了防止当Sentinel服务器宕机而使整个监控系统崩溃。监控同一个Master的Sentinel会自动连接，组成一个分布式的Sentinel网络，相互通信并且交换彼此对Master的监控信息，如下图所示：

redis主从复制与哨兵模式

工作过程：

Sentinel会不断检查Master和它的slave是否正常，当一个Sentinel监控到有个服务器下线(出故障了)，它会向哨兵网络的其他Sentinel进行确认，判断该服务器是否真的下线(出故障了)；如果下线的服务器是master服务器，Sentinel网络会对下线master服务器进行自动故障转移：将该master服务器旗下的某个slave服务器提升为新的master服务器，并且在其他slave服务器中设置新的master服务器。(若下线的服务器重新上线，它将变为slave服务器，请求复制新选举的master)

注意：Sentinel在选举新的slave节点为master节点时，会修改所有相关节点的配置文件redis.conf，包括哨兵自己的配置文件sentinel.conf

5.2 配置sentinel.conf

启动一个哨兵Sentinel需要sentibel.conf，该配置文件可以在redis的源码包找到。当启动了多个哨兵sentinel，监听相同master的sentinel就会自动组成一个哨兵网络。一个哨兵网络内的sentinel，它们的配置文件

sentibel.conf，除了端口号不一样外，其它属性基本一致。

常用属性配置：

// Sentinel节点启动时占用的端口(默认是26379)

// dir是sentinel节点的工作目录

// logfile是sentinel节点的日志记录文件名

port 26379

dir /var/redis/data/

logfile "26379.log"

// 当前Sentinel节点监控 127.0.0.1:6379 这个主节点(即master)

// mymaster是主节点的别名，后面的配置就可以使用这个别名

// 2代表判断主节点故障，至少需要2个Sentinel节点认可

sentinel monitor mymaster 127.0.0.1 6379 2

(注：这边为什么只需要配置master服务器即可？因为slave服务器的信息可以从master服务器拿到)

//每个Sentinel节点都要定期PING命令来判断Redis数据节点和其余//Sentinel节点是否可达，如果超过30000毫秒且没有回复，则判定不可达

sentinel down-after-milliseconds mymaster 30000

//当Sentinel节点集合对主节点故障判定达成一致时，Sentinel领导者节点//会做故障转移操作，选出新的主节点。原来的从节点会向新的主节点发起复制//操作，限制每次向新的主节点发起复制操作的从节点个数为1

sentinel parallel-syncs mymaster 1

//故障转移超时时间为180000毫秒

sentinel failover-timeout mymaster 180000

//如果redis服务节点配置了认证，则Sentinel需要配置认证密码，不然它//连接不上该服务节点，更谈不上监控了

//mymaster是配置监控节点时设置的别名，root是redis服务节点的密码

sentinel auth-pass mymaster root

5.3 启动sentinel

配置好sentinel.conf以后，就可以启动一个哨兵实例，有两种方式启动：

①使用redis-server启动

命令：redis-server <sentinel.conf路径> --sentinel

例子：redis-server /usr/redis/sentinel.conf –-sentinel

②使用redis-sentinel启动

将redis源码包/src/redis-sentinel程序文件拷贝到redis安装包的bin目录下（如果bin目录已经有redis-sentinel，这一步就可以省略了）。

命令：redis-sentinel < sentinel.conf路径>

例子：redis-sentinel /usr/redis/sentinel.conf

启动并且监听成功的信息：

redis主从复制与哨兵模式

redis主从复制与哨兵模式

1. 主从配置

2.主从拓扑

3.主从同步策略

3.1 全量同步

3.2 增量同步

4.主从同步原理

4.1 SYNC

4.2 PSYNC

4.2.1 复制偏移量

4.2.2 复制积压缓冲区

4.2.3 服务运行ID

5.哨兵模式

5.1 sentinel工作流程

5.2 配置sentinel.conf

5.3 启动sentinel

继续阅读

Redis的快速上手与基本使用

docker 搭建Redis 问题解决

如何解决Redis缓存击穿、雪崩、穿透问题

java 版本的redis-stat不能运行在后台和daemon

常见的error 1236 报错

redis管理常用命令

django短信验证码的后端实现

Redis订阅了一段时间后订阅失效了（ redisTemplate.convertAndSend）

2022秋招面试总结（cpp+java+测开）百度测开一面字节后端一面虾皮后端一面虾皮后端二面

数据迁移方法数据迁移原则数据迁移之双写方案数据迁移之级联同步方案

微服务-性能压测\缓存redis和分布式锁redisson和SpringCache

Nacos 2.0 升级前后性能对比压测

Spring数据和Redis

redis集群数据一致性_RedisRaft为Redis集群带来强大的数据一致性

supervisor 管理redis 和httpd 环境centos7

Redis简介一(单机版)发展历程Redis