一文搞懂 Redis 架构演化之路(腾讯技术工程)

引言

redis是目前最流行的缓存中间件，但他是如何保证实现稳定并且高性能的提供服务的？

如果只是单机版redis，有什么问题？
宕机后，如何快速恢复？
主从集群以及sentinel可以带来怎样的优势？
分片集群作用？

这篇文章从0到1，一步步构建出当前的redis

单机redis

如上图所示，项目的数据最简单的就是直接从mysql读取，现在多了一个redis缓存，并使用cache aside pattern。

在服务不断运行中，项目中redis存储的数据越来越多，如果突然redis宕机，由于redis是内存数据库，全部的数据都会丢失。

读数据：就算redis重启了，数据丢失了，构建缓存的过程中数据库压力很大
写数据：如果有写数据还没有写入到数据库，数据就永久丢失了

持久化：有备无患

AOF

最简单的持久化操作就是：每执行一个命令，除了更新redis内存外，还写入磁盘，也就是磁盘和redis始终同步。

问题：写磁盘的速度肯定是跟不上redis，如果希望强一致性，那磁盘的读写速度就是redis的性能极限，性能急剧下降。

数据从内存到磁盘分两步：

程序写文件的 PageCache（write）
把 PageCache 刷到磁盘（fsync）

刚才是每次都执行这两步，现在可以只执行第一步，然后让后台线程去执行fsync操作

其实这就是AOF，（Append Only File）。

Redis AOF 持久化提供了 3 种刷盘机制：对应着fsync的不同时机

appendfsync always：主线程同步 fsync
appendfsync no：由 OS fsync
appendfsync everysec：后台线程每间隔1秒 fsync；大大减小了io的频率

随着时间推移，AOF文件可能越来越大，redis还提供了AOF rewrite使得AOF【瘦身】，如 set k1 v1，set k1 v2，其实我们只需要记录后一条命令就好了（最终版本）

RDB

除了使用基于命令的方式，还可以使用最常用的基于数据快照实现数据的备份

快照的备份时机可以定时的，也可也是最近一段时间数据的修改量 save 300 10 # 100s内有10个key修改了则触发bgsave

优点

持久化体积小（二进制+压缩）
写盘频率

缺点也很明显，因为是定时持久化，数据肯定没有 AOF 实时持久化完整。

如果你的 Redis 只当做缓存，对于丢失数据不敏感（可从后端的数据库查询），那这种持久化方式是非常合适的。

如果让你来选择持久化方案，你可以这样选择：

业务对于数据丢失不敏感，选 RDB
业务对数据完整性要求比较高，选 AOF 但文件体积更大、恢复更慢

混合持久化

如何保证数据完整性，又可以让文件更小（恢复更快）呢？

数据完整性：想要保住数据完整性，就需要从AOF下手（记录下每条命令），还想要体积更小，就将RDB快照（二进制+压缩）嵌入到AOF中

当 AOF 在做 rewrite 时，Redis 先以 RDB 格式在 AOF 文件中写入一个数据快照，再把在这期间产生的每一个写命令，追加到 AOF 文件中。

数据恢复时，先加载AOF中的RDB，再执行命令

现在已经实现单机的恢复，但恢复启动的过程中服务还是宕机的，解决方法：引入多个 Redis 实例，这些实例实时进行同步，当一个宕机后剩下的立马可以补救【主从复制：多副本】

主从复制：多副本

缩短不可用时间：master 发生宕机，我们可以手动把 slave 提升为 master 继续提供服务
提升读性能：让 slave 分担一部分读请求，提升应用的整体性能

但它的问题在于：当 master 宕机时，我们需要「手动」把 slave 提升为 master，这个过程也是需要花费时间的。

优化：切换的过程，变成自动化？

哨兵：故障自动切换

引入哨兵实现服务的监控
多个哨兵避免网络问题引起的波动

哨兵协商判定 master 异常后，这里还有一个问题：由哪个哨兵来发起主从切换呢？

答案是，选出一个哨兵「领导者」，由这个领导者进行主从切换。

问题又来了，这个领导者怎么选？

想象一下，在现实生活中，选举是怎么做的？

是的，投票。

在选举哨兵领导者时，我们可以制定这样一个选举规则：

每个哨兵都询问其它哨兵，请求对方为自己投票
每个哨兵只投票给第一个请求投票的哨兵，且只能投票一次
首先拿到超过半数投票的哨兵，当选为领导者，发起主从切换
这个选举的过程就是我们经常听到的：分布式系统领域中的「共识算法」。

什么是共识算法？

我们在多个机器部署哨兵，它们需要共同协作完成一项任务，所以它们就组成了一个「分布式系统」。

在分布式系统领域，多个节点如何就一个问题达成共识的算法，就叫共识算法。

在这个场景下，多个哨兵共同协商，选举出一个都认可的领导者，就是使用共识算法完成的。

这个算法还规定节点的数量必须是奇数个，这样可以保证系统中即使有节点发生了故障，剩余超过「半数」的节点状态正常，依旧可以提供正确的结果，也就是说，这个算法还兼容了存在故障节点的情况。