Kafka多种跨IDC灾备方案分析.docx
《Kafka多种跨IDC灾备方案分析.docx》由会员分享,可在线阅读,更多相关《Kafka多种跨IDC灾备方案分析.docx(24页珍藏版)》请在第一文库网上搜索。
1、Ka妹a多种跨IDC灾备方案分析1前言为了尽量减少自然和人为灾难(如停电、灾难性软件故障和网络中断)对业务的影响,以及随着我行基于Kafka的实时业务不断增长,Kafka的重要性日益增长,在我行逐步优化跨IDC的Kafka连续性建设已经成为我们目前亟待解决的问题。本文就目前已有的灾备方案在元数据同步、数据复制、消费位移同步、灾备模式等方面进行调研对比。2.现有灾备方案方案描述使用方MirrOrMakerI(简原理是启动消费者从源集群进行消费,然后发送称MM1)到目标集群,功能较简单方案描述使用方基于KafkaConnect框架实现,由1inkedIn工程MIrrorMaker2(简师贡献,修复
2、MM1的局限性,TOPiC和分区可自称MM2)或360动感知,ac1和配置可自动同步,支持双活,提基于MM2的改进供offset转换功能Conf1uentConf1Uent收费版,与MM2相比,双活模式更优Conf1uentRep1icator雅,可支持单条消息的修改基于FOI1oWer的利用Kafka的副本同步机制创建FetCher线程同字节、滴同步机制步数据,需要在原生Kafka上进行二次开发滴改进MM1,利用分布式的任务管理框架APaeheURep1icatorHeIiX控制Partitior1的分配,不需要全部Uberreba1ance改进MM1,实现思路和MM2类似,与URep1ic
3、ator一样,为了减少reba1ance,采用StiCkyASSigninent控制PartitiorI的分配,除了支持brook1in1inkedInKafka集群间的复制,还能作为AZUreEventHubs,AWSKineSiS流式服务之间的通道,另外还能作为CDC连接器3.各方案的主要设计点对比分析3.1元数据同步元数据同步主要是指ToPic、Partition.Configuration、AC1的同步,我们需要评估各方案在新增ToPic,分区扩容后、修改COnfigUratiOn和AC1后能否自动感知,以及评估方案中选择复制的ToPiC是否灵活(比如是否支持白名单、黑名单机制,是否支
4、持正则),目标集群中ToPiC名称是否发生改变(决定是否支持双向复制,是否会发生循环复制)。MM1方案中,选择复制的Topic只支持白名单机制(-white1ist或者-inc1ude参数指定),且白名单支持正则写法,但是当源集群新增ToPiC后,目标集群的auto,create,topics,enab1e设置为true时,才能自动在目标集群创建相同名称的TOPiC(可以扩展messagehand1er改名),否则必须重启MirrorMaker才能发现新增的Topic,关于目标集群上的ToPiC的分区数,MMI是按默认值num.partitions进行配置(其他方案均无该问题),无法和源集群上
5、保持一致,AC1也无法同步。相比MM1,MM2弥补了上述不足,主要是依赖MirrOrSoUrCeConneCtor里的多个定时任务实现该功能,更新TOPiC/Partition、ConfigurationAe1的间隔时长分别由三个参数指定,非常灵活。在MM2中,目前截至3.0.0的版本,支持两种复制策略,默认的DefaU1tReP1iCationPo1iCy中目标集群中复制后ToPiC名称发生变化,前面会加一个源集群的前缀,为了兼容MM1,3.0.0中新增的IdentityRep1icationPo1icy中目标集群中复制后Topic名称不会发生变化OConf1uentRep1icator,根
6、据官网描述,也同样具备上述功能,原理和MM2类似,只是检测更新只由一个参数确定。ReP1iCatOr可以定义复制后TOPiC的名称,由参数topic,rename,format指定,默认值是保持TOPiC名称不变。基于Fo11oWer的同步机制的方案,由于网上资料不足,具体实现无法得知,但是原理估计和MM2类似,复制后在目标集群中Topic名称保持不变。UReP1iCatOr的实现略有不同,复制哪些TOPic,由参数enab1eAutoWhite1ist和PatternToExc1udeTopics一起决定,当enabIeAutoWhiteIist设置为true时,若源集群和目标集群中存在相同
7、ToPic,那么不需要其他设置即可实现数据复制,若设置为fa1se,需要将复制的Topic名称等信息提交给URep1icatorContro11er,由该ContrOI1er来控制分区的分配,另外黑名单参数PatternToExc1udeTopics控制哪些Topic不用复制;分区扩容是否自动感知,是由参数enab1eAut0T0picExpansion控制的;关于Configuration和AC1无法实现同步。brook1in选择复制的TOPiC只支持白名单机制,可支持正则,新增TOPiC和分区扩容后可自动感知,检测更新由参数PartitiOnFetCh1nterVa1MS确定,复制后Top
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Kafka 多种 IDC 方案 分析