脑裂现象产生的原因和解决方法-CFANZ编程社区

在HA集群（High Availability，高可用集群）系统中，如果出现了脑裂现象，小则影响到脑裂现象对应的集群，大则影响到集群系统的整体功能。在分析脑裂产生的原因和解决方法前，我们先来看下什么是脑裂。

名词释义

HA集群系统由一个或多个集群构成，正常情况下每一个集群都是一个单独的整体，并且各节点保持着协调的工作关系，各节点之间凭借heartbeat来判定其他节点的存活状态。

以上一篇keepalived实现Nginx高可用为例，在同一个路由服务器中可能会有两个节点来协调后端服务器的工作，正常情况一个为优先级高的MASTER节点，另一个为优先级相对较低的BACKUP节点，VIP地址是飘在MASTER节点上的，在对外服务时，资源会优先被调度到MASTER节点上，由MASTER节点来向后端服务器进行转发，只有当MASTER节点出现故障不可用时，BACKUP节点因检测不到MASTER节点的心跳才会接管MASTER节点的资源，并成为新的MASTER节点对外提供服务，保证服务的高可用。

当MASTER节点出现网络堵塞等现象时，BACKUP节点因无法及时检测到MASTER节点的heartbeat而认为MASTER节点已经挂掉了，就抢来了MASTER节点的VIP，并接管了MASTER节点的资源。而MASTER节点认为自己还是正常的，这就出现了同一个服务集群中，同一个VIP地址同时飘在两个节点上的现象，即产生了两个MASTER节点，正常情况下是一个节点对外提供服务，现在也变成了两个节点能同时被用户访问到，对于一个集群同时存在两个MASTER状态的现象，我们称之为脑裂。

当脑裂现象产生时，会导致服务集群的选举机制出现问题，对于MySQL这类对写操作要求较高的服务来说，可能会带来极其糟糕的影响。