《容灾系统建设方案.docx》由会员分享,可在线阅读,更多相关《容灾系统建设方案.docx(28页珍藏版)》请在第一文库网上搜索。
1、XXXXXXX应用容灾系统建议方案1 .用户需求及针对本需求的容灾系统设计综述错误床定义书签。11应用数据安全级别的分级考虑错误!未定义书签。1.2用户需求分析:借误!未定义书签。1 .3本项目中需要注意的几个要点避误床定义书签。2 .数据容灾系统的详细设计。错误床定义书签。2.1系统设计原则82.2系统的产品选择博误I未定义书签。3.3灾备中心的组建储误!未定义书签。2.4数据容灾系统的基本结构错误!未定义书签。2.5数据的远程复制流程错误!未定义书签。2.6数据的远程恢复流程错误I未定义书签。2.7本容灾系统的结构特点错误!未定义书签。2.8数据容灾系统扩展错误!未定义书签。2.9系统投资
2、保障避误!未定义书签。3 .数据容灾系统与其他方案的简要比较错误味定义书签。4 .数据容灾系统的实施计划错误!未定义书签。4.1系统实施需求规划借误床定义书签。4.2相关性要求/实施步骤21。4.3系统配置清单避误!未定义书签。5数据容灾系统的测试承收计划。错误味定义书签。1 .1基本测试及对ORAC1E和其他类型数据的测试逆误!未定义书签。2 .2切换及回切的测试楮误!未定义书签。5 .3故障测试避误!未定义书签。6 .数据容灾系统的日常管理质练计划。错误保定义书签。7 .应用级容灾的规划错误!未定义书签。8 .后续其他节点的扩展规划错误!未定义书签。10. EMCRECOVERPO1NT的
3、维护。错误!未定义书签。附件一:美国EMC公司简要介绍错误!未定义书签。xxxXXXX应用容灾系统建议方案1 .用户需求及针对本需求的容灾系统设计综述XXXXXXX当前的应用系统类别较多,包括了办公及业务等多个方面。在平台上包括WindOWS及当前主流的多种UNIX,在存储体系上也具有多种型号的存储产品。因此,整个系统的复杂程度较大。同时,由于应用系统一经处于比较完善的程度,因此,任何的调整都将带来很大的影响。为此,为了确保数据的安全性,在早期用户实施了数据的磁带备份,但对于关键数据来说,这种磁带备份还不能够完全满足系统抵御各种灾难的能力。为此,用户考虑对数据实施灾备计划。数据的容灾保护提供最
4、基本的容灾底线保证,确保在任何预计之外的灾难发生后,业务系统都可以在允许损失极少量数据做者无损失)的情况下,在一定的时间内恢复,数据容灾同时也是应用逻辑错误和数据库软件bUg的容灾应对出发点;可以通过一定的方式来恢复到这种故障之前的可用的状态1 .1应用数据安全级别的分级考虑鉴于当前存在的大量数据,在安全性的要求上建议分出不同的优先级别,建立不同安全级别的保护措施。这样不仅在成本上会带来优势,同时也可以确保最关键数据的不丢失。这种分级保护一般根据可以承受的数据丢失量(如半小时,或者一天)来考虑。我们不妨把不允许有任何数据丢失的应用定义为安全级别最高,要求进行实时的同步的数据远程传输,对于相对来
5、讲数据安全级别稍低者可以把数据传输的优先级别作相对较低的配置,从而确保在同一时间优先发送最为关键的应用数据。而对于数据安全要求一般的数据来说,建议采用本地的磁带备份即可,而不必纳入到灾备的体系中来。这样不仅可以合理使用资金,同时也可以确保关键数据的最高级别保护。12用户需求分析:用户资料采集:用户需求分析:D数据的实时远程复制针对关键业务系统数据实现数据的实时的远程复制,从而保障数据在本地发生各种故障之后首先可以保障数据的完整性,并可以通过一定的途径快速得以恢复,或者者根据情况在远程直接启动应用。2灾备数据的可处理性,包括对数据的读写操作。所谓的读操作,是指灾备数据可以为其它的某些临时的应用提
6、供便利,支持对这些数据的读操作。从而可以方便地验证灾备体系的工作是否正常,或者者在必要的时候利用这些数据进行诸如员工培训、软件调试、相关系统的引用等多种处理。所谓的数据读写操作,是考虑利用灾备数据提供诸如员工培训、系统应用测试、后续软件调试或者其他临时应用的可能。这样,可以为上述应用带来最大的便利性。但是,为了保持和原始数据的一致性,系统应该支持上述写入操作的ReSet(S置)操作,使得在上述任务结束后,可以方便地把数据恢复到没有进行写入操作之前的状态,维持灾备数据和源数据的严格一致。另外一个方面,数据的读写支持,也可以很方便地验证灾备体系的工作是否正常。当然,这种读写操作必须要对数据的远程复
7、制和本地的应用不产生任何影响。2)(远期)应用的可切换支持。灾备中心不应该作为纯粹的备用系统,在提供诸如数据查询等应用的同时,还要提供自动的应用切换等支持,一旦在生产中心发生故障后,灾备中心的关键系统可以自动接管生产系统,提供持续的应用保障。这种规划建议作为远期的目标之一,当前建议只以数据的远程复制为主,但当前的方案必须要考虑到本要素。2 .3本项目中需要注意的几个要点通过在对用户的具体环境和需求作了细致的分析之后,我们认为用户对该数据容灾系统给以了充分的重视,所提出的观点和要求是十分详细和具体的,在此,从我们方案提供商的角度,对此作如下的概括,便于整体方案的分析。/方案的通用性。这种通用性体
8、现在两个方面:一是异构平台、存储设备的支持性,二是对不同应用类型数据的适用性,只有这样的方案才可以较好地保障用户当前投资,达到与应用类型无关、与平台无关以及与磁盘阵列等存储设备无关的适用性最广的解决方案。在当前,数据主要以OraCIe、DB2、SQ12000类型为主,但是随着应用类型的增加,产生不同类型数据的可能性还是很有可能的。如果现在选用了仅仅支持如OraCIC数据的解决方案,那末临时性的其他数据将无法得到及时的复制,或者者今后的应用扩展将受到很大的制约。/实时的数据复制解决方案。我们认为最终用户已经对不同应用数据的安全性要求做出了很好的分析和划分,其中关键数据要求不丢失,或者尽量少地丢失
9、。因此,我们认为必须要采用真正的实时的数据复制解决方案才可以满足这种要求。在条件具备的情况下,应该做到无延迟数据复制。而建议采用非实时或者准实时复制方案。/灾备数据的可用性分为两个方面,一是数据的实时复制的可靠性,要求复制数据要和源数据保持严格一致,严格按照源数据的写入顺序进行复制,使得灾备数据具有可用性。二是在需要的时候可以很便利地对灾备数据进行读写操作,但是,这种读写操作不应该对数据的实时复制产生影响。还有,在对灾备数据进行修改(如进行员工培训、软件测试等操作时对数据的采集或者调整测试)后可以恢复到原有状况,从而确保数据的一致性和安全性。/扩展的便利性包括对当前和今后其他应用类型数据的实时
10、复制的扩展,复制距离的扩展以及复制节点数量的扩展等多个方面,在当前选择方案的时候面对未来的需求进行全面考虑。/数据的丢失量对于关键应用要求数据不丢失,因此,不建议采用诸如当前在主机上开辟一定的缓存(BUgr)空间,用来存放待复制的数据,利用异步的方式发送到远程。这样的产品无疑会因为各种原因导致数据的丢失率较大,如当主机资源意外掉电或者宕机时,上述BUneK缓存)中的数据必然会被丢失。我们推荐在主机产生写入操作的同时数据被发送出去,这样,数据始终保持和本地的写入同步,这样的方案才可以真正做到数据的无丢失。/数据的可回滚性(最新数据不可用情况下的数据恢复支持)不可避免地会在某些情况下,最新复制的数
11、据不可用的情况下,尤其对于Orade数据库,很可能在管理员发现故障时,其内部已经在几分钟之前就已经出现了问题,那末,被复制过去的数据肯定也是不能够被使用的。此时,我们必须要具有数据的回滚性支持,比如可以往前回滚30秒、1分钟或者2分钟,并利用这些数据获得可用数据同时数据的丢失量最小化。/灾备自身系统实施及恢复的便利蔺易胜灾备系统的实施不应该对现有的应用系统作任何调整,尤其是对当前运行较稳定的系统。当然,即使需要一定的调整。那末。这种调整夜必须是系统管理员可以理解并接受的。同样,对于灾备系统自身而言,发生问题后的解决或者全面的恢复也要简易化,要支持如WEB管理,图形化管理,而不应该需要较复杂的配
12、置。否则,今后如果需要作系统调整,那末,系统管理员将无法面对这种配置和管理,甚至导致日常的维护也不敢动手的现状。/对系统的影响最小化由于当前应用系统的完善性和稳定性,不建议为了本灾备系统而对当前的应用系统做任何方面的调整。主机资源不能够因为灾备系统的实施而显得紧张,包括内存、CPU等资源的占用应力求最小化。当然这种影响我们认为同样包括实施时候对系统、对数据库、对应用的调整合对存储空间的调整等多个方面。/灾备方案要支持策略化配置便于不同的应用数据具有不同的复制优先级别,以确保关键数据不丢失。/灾备系统的管理简易性为了确保灾备系统的正常运行,在日常的管理中必须要进行一定的演练,以保障需要时候的迅捷
13、相应和确认灾备系统可用性。那末,这种日常的演练活动必须要简单,也就是灾备系统自身必须要具有简易的人性化的管理,同时,在对灾备数据作验证时不应当对生产系统产生任何影响。还有,系统自身故障后应该具有很便利的方式直接来恢复,而不需要重新配置。/灾备数据具有不影响复制的读写支持,同时支持写入操作后的ReSet(数据重置)为了充分利用灾备数据,方案必须要支持对灾备数据的读写,同时,该读写的过程不应该影响数据的继续复制。这样,我们可以利用灾备数据进行诸如软件调试、员工培训、系统测试、灾备系统测试、演练等多种操作。但是,一旦在这种练习结束后,必须要要保证灾备数据恢复原样,保持和实际数据一致。/相关故障的自恢
14、复故障报警功能系统涉及到大量的专业设备或者技术,因此,灾备系统必须要具有很强的相关故障自恢复功能。如WAN故障、主机故障、应用系统故障等相关因素在恢复正常后,灾备系统也应该自动恢复运行,保持数据的实时复制。另外,灾备系统自身应该具有完善的日志和报警机制,减轻管理员的负担。/灾备系统具有较强的数据传输性能(高度的压缩等能力)由于系统基于IP链路设计,因此,必须要具有很高的数据传输能力,才可以保障在有限的带宽资源环境下提高数据的复制性能。这种性能的提高很大程度上是靠较高的压缩率来时实现的,我们建议灾备系统要具有超过10倍的压缩率。2 .数据容灾系统的详细设计21系统设计原则在基于当前的先进技术及产
15、品的情况下,结合整体造价,提供最高性价比的整体解决方案是我们这次规划的主要原则。同时在遵循用户提出的设计原则的前提下,我们还充分考虑了如下的设计理念:/最高的性价比。根据用户应用的实际需求,提供适宜的解决方案,在有限的资金许可范围内,提供符合上述需求的方案,并降低后续的维护成本,从而提高系统的整体性价比。/实时的数据复制,数据丢失率最小化。/策略化的数据复制,保障关键应用和一般应用数据的优先级别策略化,确保关键数据不丢失。/严格的数据一致性。/灾备数据的可读写支持,在进行读写的同时不影响正常的数据复制,灾备数据在被操作后致支持重置,确保与原数据一致。/基于WEB、G1J1(图形管理)及C1I(命令行)多种管理方式。/对应用系统影响最小化;自身故障对应用系统无影响。/实施便利,无须对应用作任何调整。/广泛的适用性,数据复制和应用类型、数据类型没有任何关系,支持异构的平台和存储设备。/高性能的数据传输,具有高度的数据压缩率(高于10倍),提高数据复制性能。2.2系统的产品选择我们选用业界最领先的美国EMC公司的RECOVERPo1NT产品作为本系统数据的实时复制(容灾)产品。EMC公司总部在美国加利福尼亚州,在美国纽约、圣何塞碓谷)及以色列具有研发基地,专门致力于数据安全解决方案的技术研发。在数据容灾日益成为大家关注的话题的同时,EMC推出