企业备份系统运维管理的核心问题.docx
《企业备份系统运维管理的核心问题.docx》由会员分享,可在线阅读,更多相关《企业备份系统运维管理的核心问题.docx(8页珍藏版)》请在第一文库网上搜索。
1、企业备份系统运维管理的核心问题Aa【摘要】对于每一个企业来讲,数据备份恢复是企业IT运维当中非常重要的一部分。如何保障必要的数据在必要的时间完成必要模式的备份,并且能在需要的时刻将正确的数据在正确的位置恢复,这是数据备份恢复运维工作必然的考核指标。本文通过大量的运维实践总结出备份系统运维工作当中遇到的一些关键问题,并且按照实际解决方案提炼解决思路。希望能给企业日常的备份系统运维带来一些启示和帮助。【关键字】备份介质;备份作业;备份系统1 .如何解决平衡数据库归档频度和数据恢复完整性1.1 数据库恢复的基本原理对于数据库的恢复来说有很多种,我们只讨论需要介质恢复的情况。在这种场合下,首先我们需要
2、找到一个最近时刻点的全量备份进行恢复;然后需要从备份介质上找到这个时刻点之后的重做日志进行数据追平,最后我们需要找到本地没有丢失的重做日志进行再次追平直到没有可用日志。如下图所示:图1数据库恢复原理示意图如图所示,在时刻A,我们开始做在线全库备份,在B时刻全库备份结束。当数据库运行到E时刻之后数据库发生了重大介质故障,只能通过介质恢复。那么在AC时间段内,大部分REDO日志文件都已经归档到备份介质池当中,服务器本地存储目录当中只剩下CE(小于一个归档备份时间间隔)的归档日志和没有来得及归档的REDO日志文件。假设发生的故障严重到服务器本地存储目录也无法恢复的时候,那么相当于在C-E这段时间产生
3、的重做日志就丢失掉了。相当在这种极端场合下,数据丢失的最大窗口就是一个归档间隔时间段。当然如果把这个间隔设置的足够小的话,那么另外的问题就产生了,备份作业随着系统增加会呈爆发式并发启动状态,最终会影响到整个备份系统的健康运行导致归档无法及时转储,最终还是可能会导致数据库的宕机。这就是一个矛盾,需要我们去很好的平衡。1.2 平衡数据库归档频率的方法数据库归档备份的频率是指一天24小时内间隔多长时间进行一次归档日志的备份,一方面是要保障增量数据备份的完整性,另外一方面是要避免因为恢复空间不足导致数据库的宕机时间。要平衡这个频率窗口需要采集以下几类数据:1)单位时间内不同数据库系统平均的归档日志量。
4、采集这个数据的目的在于详细分析不同业务系统在不同时间段的写操作频繁程度。对于日志归档速度较快的系统,我们需要提高其恢复区的空间大小,同时加快归档备份的频率,使得数据库既能处于安全运行状态又能保障极端故障场合下数据丢失的量在较小范围之内。2)业务系统类型。所谓业务系统类型即O1TP或者是O1AP,因为对于O1AP来讲,每次的读写操作都会是批量的执行,它的归档速度是正常O1AP系统的几十倍甚至上百倍。最麻烦的是两者皆有的业务系统,比如说银行业中的交易系统,白天跑联机交易,晚上跑核算批量,白天和晚上的日志归档速度有着巨大的反差。那么我们就需要在批量作业时间段内将备份频率调快,将恢复区空间设置提高。3
5、)备份系统可以容忍的最大并发量。备份系统可以容忍的最大并发Jobs,不仅仅取决于备份软件系统可以并发调度的作业数目和备份作业服务器的数目,还要取决于备份介质池可以容忍的资源消耗限制。及时我们可以同时调度几百个作业,但是当几十个作业同时写入备份介质池时就会把备份介质池的计算资源或者是IO资源使用殆尽。那么最终整个备份系统的并发数取决于短板因素。4)不同数据库系统恢复区能够支撑最小时间窗口。这个最小时间窗口是我们用数据库的恢复区可用空间大小/单位时间内的最大归档速度来估算出来的时间窗口。因为我们在安装数据库或者是做变更的时候不可能按照每一个系统的特点详细计算出其日志存储空间的大小,只能按照有限的几
6、个规格来做初始规划。有了以上数据之后,我们需要根据以下几个原则来详细设计我们的归档作业频率。首先,根据4当中采集到的数据,将时间窗口较小的几个系统进行存储空间调整,使其日志存储空间能够满足我们期望的最小时间标准。然后,将一天24小时定义为几个时间段,批量业务集中的时间段、联机业务集中的时间段、特殊任务集中的时间段等。当然这个定义主要是根据1&2中采集到的详细数据来定义的。接着,我们需要根据1中数据估算出一个归档作业大概持续的时间长度。为保障每一个时刻点的并发执行备份作业数目远小于3中估算出来的数据。最后,需要把备份作业的频度根据不同的时间段特点调整到以上条件都满足的状态,并在此前提条件下可以为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 企业 备份 系统 管理 核心 问题
