Redis脑裂问题-面试坑点【Redis的大脑裂开？】

大家好，这里是程序员阿亮，最近发现有一个Redis比较少见的面试题—Redis脑裂问题，这里来给大家做分享，给大家避避坑。

前言

脑裂，如其名，那就是意味着脑子分成多份，那Redis的脑裂又是什么意思呢？

一、Redis脑裂是什么？

Redis 脑裂（Split-Brain）是指在 Redis 高可用架构（如哨兵模式或集群模式）中，由于网络分区或节点故障，导致系统中同时存在两个或多个节点都认为自己是主节点（Master），并各自接受写请求，从而造成数据不一致、冲突甚至丢失的现象。

二、发生条件

1.网络分区

主节点与部分从节点/哨兵失联，但自身仍能被部分客户端访问。
哨兵在另一侧选举出新主节点 → 出现两个 Master。

2.主节点短暂宕机后快速恢复

原主节点未及时降级为从节点，就重新开始接受写入。
此时新主节点也在运行 → 双主写入。

3.后果

写入到旧 Master 的数据，在其被重新同步为从节点时会被覆盖或清空（执行 SLAVEOF 或 REPLICAOF 时会全量同步新主数据）。
用户可能看到“写成功了，但数据不见了”。

三、Redis的解决方案

参数介绍

1.min-replicas-to-write（旧版本中为 min-slaves-to-write）

含义：主节点（Master）要接受写操作，必须至少有 N 个从节点（Replica/Slave）处于正常连接状态。作用：防止主节点在与大多数从节点失联时仍继续写入——这种情况下它很可能已被哨兵集群“罢免”，若继续写入会导致脑裂。

2.min-replicas-max-lag（旧版本中为 min-slaves-max-lag）

含义：从节点的复制延迟不能超过指定秒数（例如 10 秒），才被视为“有效在线”。作用：避免主节点误判“假活”从节点（如网络卡顿、进程阻塞但未断连）为健康节点，从而错误地认为自己仍具备写入资格。

解决方案

当主节点无法满足上述两个条件时，会自动拒绝写请求（返回错误），从而：

阻止旧主在脑裂场景下继续写入脏数据；
强制客户端转向新主节点；
大幅降低数据冲突和丢失的风险。

注意：这两个参数不能 100% 消除脑裂（因分布式系统本质限制），但能显著缩小脑裂发生的时间窗口，是生产环境推荐配置。

只能尽量避免

这种解决方案是生产环境推荐的配置，但是不是完全避免的。

如果我们的Redis的Master的时间宕机比较短，并且我们的min-replicas-to-write比较小，小于我们的min-replicas-max-lag，但是我们的哨兵在Master宕机的时候选了新主节点，又因为旧Master没有被废除，所以就还是会有脑裂风险。

总结

脑裂问题主要是因为网络分区或者主节点故障导致的Redis多主节点的分区问题，会导致数据不一致、数据丢失等问题。

可以通过配置合理的min-replicas-max-lag、min-replicas-to-write去尽量避免，但是无法彻底解决。

因为在CAP中，我们集群一定要要满足P，但是我们也要保证Redis的高可用性。

Redis脑裂问题--面试坑点【Redis的大脑裂开？】

前言

一、Redis脑裂是什么？

二、发生条件

1.网络分区

2.主节点短暂宕机后快速恢复

3.后果

三、Redis的解决方案

参数介绍

1.min-replicas-to-write（旧版本中为 min-slaves-to-write）

2.min-replicas-max-lag（旧版本中为 min-slaves-max-lag）

解决方案

只能尽量避免

总结

相关推荐

评论抢沙发

评论前必须登录！

热门标签

置顶推荐

热门文章

最新文章

前言

一、Redis脑裂是什么？

二、发生条件

1.网络分区

2.主节点短暂宕机后快速恢复

3.后果

三、Redis的解决方案

参数介绍

1.min-replicas-to-write（旧版本中为 min-slaves-to-write）

2.min-replicas-max-lag（旧版本中为 min-slaves-max-lag）

解决方案

只能尽量避免

总结

相关推荐

评论 抢沙发

评论前必须登录！

热门标签

置顶推荐

热门文章

最新文章

评论抢沙发