容灾架构中脑裂问题详解.docx
《容灾架构中脑裂问题详解.docx》由会员分享,可在线阅读,更多相关《容灾架构中脑裂问题详解.docx(6页珍藏版)》请在第一文库网上搜索。
1、容灾架构中脑裂问题详解摘要对于容灾架构来讲,脑裂是灾难性的事件,本文详细介绍了优先级解决方案、仲裁解决方案、仲裁冲突问题,对于了解相关场景及解决相关问题大有裨益。1 .什么是容灾中的脑裂问题?脑裂(SPIit-brain)就是“大脑分裂”,也就是本来一个“大脑”,由于某些原因被拆分了两个或多个“大脑”,我们都知道,如果一个人有多个大脑,并且相互独立的话,那么必然会出问题。在容灾架构设计当中,我们经常会利用一些HA、C1USte等高可用架构在其中,而且一般都是借助于跨地域12网络,采用跨数据中心的方式在某一个功能层组成一个独立的集群,例如数据库集群、存储网关集群等。假设因为两个数据中心节点通讯中
2、断故障导致形成了两个独立的集群,彼此独立工作,那么这就是脑裂。正如下图所示情况。第一个问题:为什么会集群可能产生脑裂?这个问题需要回到集群的仲裁机制上来,一般来讲集群的仲裁算法是以每一个节点可以获得仲裁资源的多少来判断谁是集群的主导。集群的仲裁资源无非是来自网络层面的心跳信息和共享存储的磁盘心跳资源,在普通的节点层故障场合下,发生故障的节点可以获得的仲裁资源就会少于其他节点,那么就不会发生脑裂问题。但是在一种特殊的场合(双数据中心之间的网络发生了故障),两个节点可以获得的仲裁资源是一样的,网络彼此不能互通,存储彼此不能看到对方,这样的的场景下仲裁就会失效,脑裂发生。第二个问题:集群如果发生了脑
3、裂问题,那么会造成什么样的结果?那么为什么说对于容灾架构来讲,脑裂是灾难性的事件呢?如果从一个统一集群的调度变成两个相互独立的集群调度,意味着双方的写操作相互也是独立的,但是他们的存储空间是共享的,AA模式下通过锁机制控制并发,HA模式下通过存储卷的Owner控制写的权限。但是独立之后意味着两个集群可以随时写入同样的存储地址,必然会造成脏写脏读等一系列数据不一致事件。这对业务来讲是灾难性的。2.优先级解决方案如图所示,以两个节点的Orac1eRAC为例来讲,ORAC1ERCASM管理模式下,磁盘组通常有三个(+DATA,+FR,+OCR),在OCR磁盘组当中所有的磁盘中存储的数据包括两部分,一
4、部分是VoteFiIe,另外一部分就是OCR(OraCIeCIUSterRegiStry)。VOteFiIe是用来记录集群节点的磁盘心跳信息,而OCR是保存集群配置信息的数据。VoteFi1e,以整个文件的方式存储在OCR磁盘上,不做任何条带。下图是其信息记录的一个说明:Instance1OKNGNGInstance2NGOKOKInstance3NGOKOKInstance1Instance2Instance3以上是一个三节点的ORAe1ERAC集群的VOteFne的一个示意矩阵,每一行是一个节点的写入的信息,例如第一行,InStanCeI分别把其对集群中的三个成员(1、2、3)进行私网检测
5、的结果写入到仲裁文件当中,InStanCe2、Instance3同样把其检测结果写入仲裁文件,最终组成了三个节点的仲裁矩阵。当私网发生故障而从网络上导致集群分割为几个孤岛子集的时候,网络心跳同票数情况下,仲裁算法有两个非常重要的规则:保障隔离后的集群子集中节点数目最多的子集存活。当隔离后的集群子集获得的仲裁票数相等时,保障实例号小者存活。当两个节点的OraCIeRAC集群面临私网故障的时候,必然会遵循以上规则,从规则内容上可以看出,第一条规则基本没有什么意义,双方的资源是对等的;但是第二条规则直接决定了集群的最终状态,那就是实例号小的节点成为新的集群,这就避免了脑裂的存在。所谓资源失衡配置解决
6、方案,就是要在容灾设计之初就保障主数据中心的资源配置要多于灾备中心,使得两个数据中心节点可以获取到的仲裁资源处于不平衡状态。如上两图所示,容灾设计的时候可以将主备数据中心的节点分布数量或者仲裁文件分布数量按照2:1的非平衡策略设置。那么按照集群仲裁的一般规则:发生集群分裂故障的时候,可以获得更多仲裁资源的子集将成为新的集群。当发生数据中心之间的网络故障的时候:第一种架构,主数据中心内部两个节点可以获取到更多的网络心跳,自然会接管集群。第二种架构,主数据中心的节点可以获取到更多的磁盘心跳,同样会接管集群。这也符合我们设计之初衷。但是,这种方法只适合于AA模式的多节点集群,不适合HA模式的架构。2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 架构 中脑 问题 详解