Redis高可用

RockyNoSQL高可用Redis哨兵模式Redis Cluster大约 10 分钟

持久化

RDB

AOF

AOF重写

  1. cow机制(copy on write)
  2. 从7.0.0开始,aof文件分为base file和增量file.
Untitled
Untitled
  1. 从7.0.0开始,当开始执行aof rewrite的时候,主进程就会往一个新的增量aof文件写入数据,同时子进程就会依照现在内存中的数据创建一个新的base file。当子进程完成aof rewrite后,redis会进行一个原子操作使得新的base file生效。 感觉7.0.0的重写过程比之前的过程简单直接有效多了
Untitled
Untitled

重写过程总结:

  • 版本>= 7.0

    1. fork一个子进程
    2. 主进程开始往新的一个增量aof文件中写入数据
    3. 子进程根据当前内存的数据生成一个新的base file
    4. 如果重写失败,原来的base file和原来的增量文件以及新的增量文件仍能代表当前数据的状态
    5. 如果重写成功,主进程会收到一个signal,然后通过一个原子操作使得新的base file和新的增量文件生效
    6. 清除之前的base file以及失效的增量文件
    Untitled
    Untitled
  • 版本<7.0

    1. fork一个子进程
    2. 子进程开始根据当前内存数据生成一个新的aof文件
    3. 主进程会把这个期间收到的写命令写入一个缓冲区(当然也会同时写到aof缓存,和之前的动作一致)
    4. 如果子进程重写失败,当前正在使用的aof文件也能正常使用,所以安全
    5. 如果重写成功,主进程会把之前累计的缓冲区内容追加到新的aof文件中,然后原子的重命名aof文件
Untitled
Untitled

主从架构

  1. 主从架构可以实现读写分离,减轻master服务器的压力
  2. 但无法解决海量存储问题
  3. 无法做到高可用,一旦master宕机,无法自动failover

哨兵模式

哨兵模式就是 监工+主从模式 ,哨兵就是监工,监工的工作主要有以下3点:

  1. 监控功能: 能监测集群内所有节点(包括master、slave以及其他哨兵节点)

  2. 故障转移:当master挂掉后,由哨兵节点来选举新的master节点并进行转移

  3. 配置中心:当故障转移发生后,通知client端新的master地址

  4. 哨兵节点数至少3个

  5. 哨兵模式只能保证高可用,并不能保证数据不丢失

为什么哨兵节点至少为3个

其实不一定,需要看具体怎么部署的,如果按照下面的方式进行部署:

+----+         +----+
| M1 |---------| R1 |
| S1 |         | S2 |
+----+         +----+

M1表示Master,R1表示从节点,S1,S2表示两个哨兵

此时,quorum为1,表示只要一个哨兵认为某个节点宕机了,就可以认为这个节点客观宕机了。同时 majority为2,表示至少需要两个哨兵的授权才能执行主备切换

如果此时m1宕机了(非m1所在服务器宕机),此时还有S1/S2都还活着,所以能正常执行主备切换

但如果m1所在服务器宕机,那么S1也宕机了,此时就只有S2这一个哨兵活着,自然不能执行主备切换

  • quorum:需要多少哨兵都认为某个节点宕机时,这个节点才会被标记为客观宕机
  • majority:需要多少哨兵的授权才能执行主备切换(实际上去quorum和majority的较大值

经典的 3 节点哨兵集群

       +----+
       | M1 |
       | S1 |
       +----+
          |
+----+    |    +----+
| R2 |----+----| R3 |
| S2 |         | S3 |
+----+         +----+

此时:quorum 为 2,majority 为 2,所以如果m1所在的服务器宕机,那么还有两个哨兵节点,满足主备切换的哨兵数量要求

主观宕机

如果某个哨兵认为一个master宕机了,首先是主观宕机。

判定过程:哨兵会ping这个master,如果master在一个阈值时间内没有发送pong信息,那么这个哨兵就认为这个master主观宕机了

客观宕机

如果quorum个哨兵都认为某个master主观宕机了,那么这个master就是客观宕机了

判定过程:当某个哨兵认为某个master主观宕机后,就会~~通过gossip协议(没验证,应该不是这个协议,应该是通过pub/sub机制来完成通知)~~ 通知其他哨兵。当某个哨兵在一定时间内收到quorum个哨兵也认为这个master主观宕机的消息,那么就会被标记为客观宕机

哨兵自动发现机制

主要运用就是redis的pub/sub机制,具体过程如下:

每个哨兵会监听自己所监控的所有master/slave节点的 __sentinel:hello__ 频道,同时每隔一段时间就会把自己的host、ip、runid、以及对这个节点的监控配置发送到这个频道,其他哨兵就会收到这个消息,从而自动发现其他哨兵

主备切换大致过程

当quorum个哨兵认为某个master宕机后,并且majority个哨兵都同意进行主备切换,那么会从quorum个哨兵中选举一个哨兵来执行主备切换。会从所有的slave节点中选择一个slave成为master.

考虑的点有下面4个样子:

  1. 和master断开连接的时长
  2. slave的优先级(配置文件可以指定,越小优先级越高)
  3. offset
  4. runid

slave过滤:如果某个slave与master断开连接的时长超过了一定阈值,那么这个slave就没有资格成为master

对过滤后的slave节点按照上面的2、3、4点进行排序,然后依次尝试进行切换

版本号

执行主备切换过程中,会有个版本号,没太搞明白,这里贴出截图

Untitled
Untitled

Redis Cluster

扩展阅读: https://redis.io/docs/reference/cluster-spec/open in new window

扩展阅读: https://redis.io/docs/management/scaling/open in new window

Untitled
Untitled
  1. 节点间通信没有采用普遍使用的tcp,而是tcp-busopen in new window,是一种自组织网络
  2. 节点间通信协议是 gossip 协议(没去研究,说也是一种共识算法,模拟流行病的传播open in new window
  3. 集群中每个节点都和其他节点保持连接,并发送各种信息包
  4. 集群并不能代理请求,所以客户端的情况有可能会被重定向,有点类似http的重定向,所以理论上客户端可以给集群中的任意节点发送请求。但为了提高性能,客户端可以缓存key和node的隐射关系
  5. 固定有2^14=16384个hash槽,每次采用crc16算法对key计算hash值,然后对16384取模得到某个hash槽,然后根据槽和节点的映射关系,最终路由到某个节点上
  6. 客户端可以通过hash tag的方式来让某个key的请求固定走某个hash槽
  7. 所有节点都各自持有一份元数据,如果发生变更,则通过gossip协议告知其他节点
  8. 比如3个master,每个master后面又挂多个slave

JedisCluster客户端工作过程

  1. 每个jediscluster客户端都会在本地维护一个hash slot到node节点的隐射表
  2. 当对某个key执行操作的时候,会先在本地计算出这个key的crc16值,然后对2^14(16384)取模,得到hash slot,然后根据hash slot到node节点的隐射表,找到对应的node节点(可能正确,可能错误)。
  3. 然后对这个node节点发起请求,接收到请求的node节点发现这个slot恰好在自己这边,则执行请求。否则返回moved或ack
  4. 如果客户端收到moved请求,则更新本地的映射表,并重新发起请求。
  5. 如果客户端5次尝试都不成功,则报错

主备切换大致过程

其实过程和哨兵模式下的主备切换大致相同,都可以分为下面几步

  1. 先标记客观宕机

    如果一个节点认为某个master节点宕机了,则是主观宕机。

    如果过半节点都认为这个master节点宕机了,则是客观宕机。(通过gossip协议通讯)

  2. slave过滤

    对宕机的master节点的所有从节点进行过滤

    如果从节点与master节点的断开时间超过一定阈值,则这个从节点没有资格成为master节点

  3. 执行主备切换

    对剩下的从节点进行排序,排序维度有 priority、offset、runid。然后依次尝试进行主备切换

备注:上面整理的内容对一些细节肯定是不对的,这里只是为了从整体上了解其中的原理或过程

Twemproxy

扩展阅读:https://github.com/twitter/twemproxyopen in new window

Codis(基本废弃了)

github都4年多没更新了 , https://github.com/CodisLabs/codisopen in new window

题外话

分享一个查看linux函数、系统调用的好网站: https://linux.die.net/man/open in new window

之前不理解什么section 2 ,看了上面的网页就明白了,原来Linux用户手册分为了好几部分,section 2就是第二部分,里面包含的是系统调用相关的介绍(为之前的愚蠢感到可笑 😂)

  • 高可用的根部就是:冗余 + 分片
  • 至于怎么实现冗余,那就不尽相同

系统推荐









  • 随机毒鸡汤:你我本无缘,全靠我花钱。