Redis哨兵选举失败,如何排查monitor配置及仲裁节点数问题?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1029个文字,预计阅读时间需要5分钟。
《强盗选举失败,八成是quorum值和实际在线强盗数不匹配,或者sentinel监控配置不同步到全部节点。
为什么 sentinel monitor 配置不一致会导致选主卡死
哨兵不是靠本地配置文件启动后就一劳永逸的——sentinel monitor 这条指令定义了监控哪个主库、用什么名字、多少秒超时、quorum 是几。它会在哨兵间通过 hello 消息广播并协商生效。如果某台哨兵没收到完整广播(比如刚启动、网络抖动、或被防火墙拦截端口),它的 sentinel monitor 视图就跟别人不一样。
结果就是:一部分哨兵认为该故障转移,另一部分压根不认这个 master 名,甚至压根没在监控它。你执行 SENTINEL masters 会发现有的哨兵返回空,有的返回 fail 状态,但状态不统一。
本文共计1029个文字,预计阅读时间需要5分钟。
《强盗选举失败,八成是quorum值和实际在线强盗数不匹配,或者sentinel监控配置不同步到全部节点。
为什么 sentinel monitor 配置不一致会导致选主卡死
哨兵不是靠本地配置文件启动后就一劳永逸的——sentinel monitor 这条指令定义了监控哪个主库、用什么名字、多少秒超时、quorum 是几。它会在哨兵间通过 hello 消息广播并协商生效。如果某台哨兵没收到完整广播(比如刚启动、网络抖动、或被防火墙拦截端口),它的 sentinel monitor 视图就跟别人不一样。
结果就是:一部分哨兵认为该故障转移,另一部分压根不认这个 master 名,甚至压根没在监控它。你执行 SENTINEL masters 会发现有的哨兵返回空,有的返回 fail 状态,但状态不统一。

