Redis 运维实战 第01期:Redis 复制

作者简介

马听,多年 DBA 实战经验,对 MySQL、 Redis、ClickHouse 等数据库有一定了解,专栏《一线数据库工程师带你深入理解 MySQL》作者。

从这篇文章开始,将出几期 Redis 运维实战相关的内容,大致包括:Redis 主从、Redis 集群、持久化、大 key、热 key、Redis 监控以及 Redis 规范等。

本节先从 Redis 主从复制开始聊。

首先来看 Redis 复制的配置:

1 配置 Redis 主从复制

1.1 配置复制

Redis 安装可以参考官方文档(https://redis.io/download),配置 Redis 主从复制的方法如下(本节内容的 Redis 版本为 6.0):

直接登录 Redis 之后,在从节点执行如下命令:

replicaof {masterHost} {masterPort}

拓展:

Redis 5.0 之前配置复制是使用 slaveof 命令的,从 5.0 开始,可以使用 replicaof 配置复制,当然继续用 slaveof 也行的。

如果要停止复制,则在从节点执行如下命令即可:

replicaof no one

1.2 查看复制信息

使用下面命令可以查看复制信息:

info replication

这里解释一下上图参数所代表的含义:

那么在我们执行完 replicaof 命令后,Redis 是如何完成历史数据以及增量数据同步的?这里就需要聊到 Redis 的复制原理。

2 复制原理

第一次建立复制过程大致原理如下:

保存主节点信息:执行 replicaof 后从节点只保存主节点的地址信息便直接返回

主从建立连接:从节点内部通过每秒运行的定时任务维护复制相关逻辑,当定时任务发现存在新的主节点后,会尝试与该节点建立网络连接

发送 ping 命令:连接建立成功后,从节点发送 ping 请求进行首次通信

权限验证:如果主节点设置了 requirepass 参数,则需要密码验证,从节点必须配置正确的 masterauth 才能通过验证,如果验证失败复制将停止。

同步数据集:主从连接正常后,主节点会执行 bgsave 保存 RDB 文件到本地,然后发送 RDB 文件到从节点,从节点会清空自身旧数据,然后把接收的 RDB 文件保存在本地并直接作为从节点的数据文件。对于从节点开始接收 RDB 到接收完成期间,主节点的增量命令会保存在复制客户端缓冲区内,当从节点加载完 RDB 文件后,主节点再把缓冲区内的数据发送到从节点,保证主从之间数据一致性。

命令持续复制:当从节点接收到所有数据后,则完成了复制的建立流程。接下来主节点会持续地把命令发送给从节点,保证主从数据一致。

在笔者几年的 Redis 运维工作中,多多少少会遇到一些与复制相关的问题。这里就选几个比较典型的来跟各位朋友分享,也方便你们在后续工作中绕过这些坑。

3 复制常见问题

3.1 主从延迟

由于 Redis 复制为异步复制模式,因此延迟无法避免。

判断主从节点延迟的方式是:主节点 info replication 的 master_repl_offset 和 slave0 字段的 offset 指标的差值,就是主从节点延迟的字节量。如下图:

可以看出该实例 master_repl_offset 和 slave0 字段的 offset 指标一样,因此主从没延迟。

应对延迟的方式:

可以对主从延迟进行监控,如果发现延迟,业务对数据一致性要求比较高的场景,则查询改成只走 master。如果经常性出现延迟,则建议采用集群方案。

3.2 读到过期数据

Redis 删除过期数据有两种策略:

惰性删除:主节点每次处理读取命令时,都会检查键是否过期,如果过期则执行 del 命令删除键对象,之后 del 命令也会同步到从节点,并且从节点自身不会主动删除过期数据。

定时删除:Redis 主节点内部的定时任务会循环采样一定数量的键,当发现采样的键过期时,执行 del 命令,之后再同步给从节点,如果此时有大量的键超时时,主节点采样删除的速度跟不上过期速度,且主节点没有读取过期键的操作,那么从节点将无法收到 del 命令。此时在从节点上可以读取到已经超时的数据,这种情况通常不是我们希望的。

因此在 Redis 3.2 版本解决了这个问题:从节点读取数据之前会检查键的过期时间来决定是否返回数据。

3.3 全量复制

Redis 2.8 以前的版本,只支持全量复制,如果出现网段闪断等情况,都需要重新进行全量复制,这会对主节点和网络造成很大的开销。

而在 2.8 及以上的版本,使用了 psync 命令完成主从数据同步,当同步短时间中断,主节点会把断连期间收到的写操作命令,写入 replication buffer,同时也会把这些操作命令也写入 repl_backlog_buffer 这个缓冲区。

从节点再次连上主节点时,会发送 psync 命令给主实例,并把自己当前时间点的 slave_repl_offset 发给主库,主节点会判断自己 master_repl_offset 和 slave_repl_offset 之间的差距。主节点再把 master_repl_offset 和 slave_repl_offset 之间的命令操作同步给从节点就行。

那么,到底中断到什么程度才不能继续进行增量同步了呢?这里又回到上面 repl_backlog_buffer 这个缓冲区的概念。

repl_backlog_buffer 是一个环形缓冲区,所以在缓冲区写满后,主节点会继续写入,此时,就会覆盖掉之前写入的操作。如果中断时间过久,就可能导致从库还未读取主库的操作,主库 repl_backlog_buffer 一部分就已经被覆盖了,从而导致主从数据不一致。

因此,为了避免主从节点数据不一致的情况,建议把 repl_backlog_buffer 调整的大一点。根据以往的经验,如果主从网络要调整的情况下,可以根据网段大致中断时间,然后判断该组 Redis 前几天这个时间段的内存增量,然后把 repl_backlog_buffer 调整为这个内存增量的两倍。

注:笔者在几年前就遇到过类似问题,当时使用的 Redis 版本是 2.4,存在跨机房复制的场景,某次网络波动导致重新全量同步,从而导致专线网络告警。最终升级 Redis 版本到 3.x ,网络短时间波动不再需要全量复制了。

3.4 复制风暴

复制风暴的一种情况是:一个主节点有多个从节点时,当主节点重启后,从节点会发起全量复制流程,根据上面讲的复制原理,主节点会创建 RDB 快照,而其他节点将共享这一份快照(Redis 在这里做了优化,防止创建多个快照)。此时,可能会出现这个主节点同时向多个从节点发送 RDB 快照,可能会把主节点所在机器的网卡流量跑满,从而导致主从延迟或者中断等问题。解决办法是减少主节点挂载从节点的数量,或者采用树状复制结构。

复制风暴的另一种情况是:一台机器跑了多个 Redis 节点,如果机器重启,会导致这台机器上多个主节点的 RDB 往其他机器传输,同样可能导致机器的网卡流量跑满,或者主从延迟甚至中断等问题。解决办法是主节点尽量分在多台机器上,或者提供故障转移机制。

4 复制相关建议

最终,在 Reids 复制相关功能使用中,笔者个人建议有下面这些(当然如果各位朋友有其他的一些经验建议,也欢迎在下方留言区留言补充):

建议在低峰时进行新的主从配置。

建议使用 3.2 及以上的版本。

建议一个主节点别挂载太多的从节点。

建议一台物理机上运行尽可能少的主节点。



欢迎加入 Redis 交流社群

群内不定期邀请一些身边的 Redis 大牛

交流分享,解答工作中遇到的的问题

分享工作经验、面试技巧等!加 yzlkf09

也欢迎各位大牛投稿,内容可以是数据库、开发、运维、产品、运营等!

悦专栏  LIKECOLUMN 

在这里,学好编程

做更优秀的 IT人!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 229,963评论 6 542
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 99,348评论 3 429
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 178,083评论 0 383
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 63,706评论 1 317
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 72,442评论 6 412
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 55,802评论 1 328
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 43,795评论 3 446
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 42,983评论 0 290
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 49,542评论 1 335
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 41,287评论 3 358
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 43,486评论 1 374
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 39,030评论 5 363
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 44,710评论 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 35,116评论 0 28
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 36,412评论 1 294
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 52,224评论 3 398
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 48,462评论 2 378