0
点赞
收藏
分享

微信扫一扫

Redis的持久化机制:AOF、RDB

Redis为什么需要持久化机制?

redis作为缓存,缓存的数据全部来源于数据库,那redis为什么需要做持久化呢?

企业级redis集群架构:海量数据、高并发、高可用。其中持久化是必不可少的,主要是做灾难恢复,数据恢复,也可以归类到高可用的一个环节里面去。比如你redis整个挂了,然后redis就不可用了,你要做的事情是让redis尽快变得可用,重启redis,尽快让它对外提供服务。

但如果你没做数据备份,这个时候redis启动了,也不可用的,因为没有数据,大量的请求过来,缓存全部无法命中,缓存雪崩问题,所有请求会打到mysql数据库这种数据源头中去找,一下子mysql承接高并发,然后就挂了。

 如果你把redis的持久化做好,备份和恢复方案做到企业级的程度,那么即使你的redis故障了,也可以通过备份数据,快速恢复,一旦恢复立即对外提供服务。

redis的持久化,跟高可用,是有关系的。redis持久化机制有两种:RDB,AOF。

RDB:

如何配置RDB持久化机制

redis.conf文件,也就是/etc/redis/6379.conf,去配置持久化:

每隔60s,如果有超过1000个key发生了变更,那么就生成一个新的dump.rdb文件,就是当前redis内存中完整的数据快照,这个操作也被称之为snapshotting,快照。

也可以手动调用save或者bgsave命令,同步或异步执行rdb快照生成。

save可以设置多个,就是多个snapshotting检查点,每到一个检查点,就会去check一下,是否有指定的key数量发生了变更,如果有,就生成一个新的dump.rdb文件。

RDB持久化机制的工作流程

1、redis根据配置自己尝试去生成rdb快照文件;

2、fork一个子进程出来;

3、子进程尝试将数据dump到临时的rdb快照文件中;

4、完成rdb快照文件的生成之后,就替换之前的旧的快照文件 dump.rdb,每次生成一个新的快照,都会覆盖之前的老快照。

AOF:

AOF持久化的配置

AOF持久化,默认是关闭的,默认是打开RDB持久化,可以打开AOF持久化机制,在生产环境里面,一般来说AOF都是要打开的,除非你说随便丢个几分钟的数据也无所谓。

打开AOF持久化机制之后,redis每次接收到一条写命令,就会写入日志文件中。当然,是先写入os cache的,然后每隔一定时间再fsync一下到磁盘中。 只有通过fsync真正落到磁盘中的数据才是不会丢失的。

可以配置AOF的fsync策略,有三种策略可以选择,一种是每次写入一条数据就执行一次fsync; 一种是每隔一秒执行一次fsync; 一种是不主动执行fsync:

AOF rewrite

redis中的数据其实有限的,很多数据可能会自动过期,可能会被用户删除,可能会被redis用缓存清除的算法清理掉,redis中的数据会不断淘汰掉旧的,就一部分常用的数据会被自动保留在redis内存中,所以可能很多之前的已经被清理掉的数据,对应的写日志还停留在AOF中,AOF日志文件就一个,会不断的膨胀,所以AOF会自动在后台每隔一定时间做rewrite操作。比如日志里已经存放了针对100w数据的写日志了,redis内存只剩下10万,基于内存中当前的10万数据构建一套最新的日志到AOF中,覆盖之前的老日志,确保AOF日志文件不会过大。

在redis.conf中,可以配置rewrite策略:

比如说上一次AOF rewrite之后,是128mb 然后就会接着128mb继续写AOF的日志,如果发现增长的比例,超过了之前的100%,256mb,就可能会去触发一次rewrite 但是此时还要去跟min-size,64mb去比较,256mb > 64mb,才会去触发rewrite:

AOF破损文件的修复

如果redis在append数据到AOF文件时,机器宕机了,可能会导致AOF文件破损。用redis-check-aof --fix命令来修复破损的AOF文件。

AOF和RDB同时工作

1、如果RDB在执行snapshotting操作,那么redis不会执行AOF rewrite; 如果redis再执行AOF rewrite,那么就不会执行RDB snapshotting

2、如果RDB在执行snapshotting,此时用户执行BGREWRITEAOF命令,那么等RDB快照生成之后,才会去执行AOF rewrite

3、同时有RDB snapshot文件和AOF日志文件,那么redis重启的时候,会优先使用AOF进行数据恢复,因为其中的日志更完整。

RDB VS AOF

RDB和AOF两种持久化机制的介绍

RDB持久化机制,对redis中的数据快照执行周期性的持久化。

AOF机制对每条写入命令作为日志,以append-only的模式写入一个日志文件中,在redis重启的时候,可以通过回放AOF日志中的写入指令来重新构建整个数据集。

RDB持久化机制的优点

1、对读写服务影响小:RDB对redis对外提供的读写服务,影响非常小,可以让redis保持高性能,因为redis主进程只需要fork一个子进程,让子进程执行磁盘IO操作来进行RDB持久化即可。

2、数据恢复快:相对于AOF持久化机制来说,直接基于RDB数据文件来重启和恢复redis进程,数据恢复更加快。 AOF存放的指令日志,做数据恢复的时候,其实是要回放和执行所有的指令日志,来恢复出来内存中的所有数据的。RDB就是一份数据文件,恢复的时候,直接加载到内存中即可。

RDB持久化机制的缺点

1、丢失数据多:如果想要在redis故障时,尽可能少的丢失数据,那么RDB没有AOF好。一般来说,RDB数据快照文件,都是每隔5分钟,或者更长时间生成一次,这个时候就得接受一旦redis进程宕机,那么会丢失最近5分钟的数据。这个问题也是rdb最大的缺点,就是不适合做第一优先的恢复方案,如果你依赖RDB做第一优先恢复方案,会导致数据丢失的比较多。

2、服务暂停:RDB每次在fork子进程来执行RDB快照数据文件生成的时候,如果数据文件特别大,可能会导致对客户端提供的服务暂停数毫秒,或者甚至数秒。一般不要让RDB的间隔太长,否则每次生成的RDB文件太大了,对redis本身的性能可能会有影响的。

AOF持久化机制的优点

1、数据丢失少:AOF可以更好的保护数据不丢失,一般AOF会每隔1秒,通过一个后台线程执行一次fsync操作,保证os cache中的数据写入磁盘中,即使redis进程挂了,最多丢掉1秒钟的数据。

2、磁盘顺序写入:AOF日志文件以append-only模式写入,所以没有任何磁盘寻址的开销,写入性能非常高,而且文件不容易破损,即使文件尾部破损,也很容易修复。

3、重写对服务影响小:AOF日志文件即使过大的时候,出现后台重写操作,也不会影响客户端的读写。因为在rewrite log的时候,会对其中的指导进行压缩,创建出一份需要恢复数据的最小日志出来。再创建新日志文件的时候,老的日志文件还是照常写入。当新的merge后的日志文件ready的时候,再交换新老日志文件即可。

AOF持久化机制的缺点

1、文件大:对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大

2、降低了写服务并发:AOF开启后,支持的写QPS会比RDB支持的写QPS低,因为AOF一般会配置成每秒fsync一次日志文件,当然每秒一次fsync性能也还是很高的,但如果AOF的fsync设置成每写入一条数据就fsync一次,那就大大降低了redis的写服务并发。

3、数据恢复慢:唯一的比较大的缺点,其实就是做数据恢复的时候会比较慢。

RDB和AOF到底该如何选择

1、要仅仅使用RDB,因为那样会导致你丢失很多数据

2、也不要仅仅使用AOF,因为那样有两个问题,第一,你通过AOF做冷备没有RDB做冷备的恢复速度更快; 第二,RDB每次简单粗暴生成数据快照,更加健壮,可以避免AOF这种复杂的备份和恢复机制的bug。

3、综合使用AOF和RDB两种持久化机制,用AOF来保证数据不丢失,作为数据恢复的第一选择; 用RDB来做不同程度的冷备,在AOF文件都丢失或损坏不可用的时候,还可以使用RDB来进行快速的数据恢复。

举报

相关推荐

0 条评论