超算中心运维管理方案.docx
《超算中心运维管理方案.docx》由会员分享,可在线阅读,更多相关《超算中心运维管理方案.docx(9页珍藏版)》请在第一文库网上搜索。
1、超算中心运维管理方案学生姓名王排学 院软件学院专业班级软件工程13C学生学号13250129手机13726784637一, 超算中心运维需求及分析 超算中心需求:依据服务指标运行情况,建立运维服务水平评价体系:服务运行指标体系覆盖系统连续性服务能力、系统设备可用性、人员服务能力、项目管理等方面,通过服务指标监控和运行分析,实现对运行服务的集中、分级管理和监控,并能够及时调整运行维护策略,促进运维质量和效率的提高。从整体运维、优化的角度,包括但不限于实现以下内容,并根据实际业务运行需求不断完善优化:1) 项目管理:为保证项目顺利实施所需的项目整体规划、进度控制、相关方沟通,组织并协调驻场人员、分
2、包商、供应商、设备厂商、承建商及维保商等等共同配合推进运维项目的顺利进行。2) 设备管理:根据运维目标针对各软硬件系统、设施制定使用、维护、操作规范,形成有效的管理机制,分析各系统风险点和项目实施期间发现的问题并制定相应的解决和优化方案,并跟进日常各种问题、故障的处理实施情况,提高机房的可用性。3) 机房容量管理:根据机房实际情况与业务发展需要,综合供配电、制冷、消防、承重、设备管理等等因素,制定机房的空间及设备上线管理规范,提高机房基础环境的利用率;4) 生产安全管理:根据国家有关的法律法规及行业规范,从生产运行、人身安全、资产、信息等角度制定安全管理制度,并切实执行,实现运维期内安全零事故
3、;5) 服务质量管理:根据实际运维工作需要,制定服务质量标准及质量控制规程,通过培训、演练等多种方式实现对项目实施质量的控制,保证各项要求、规范的实施效果。6) 资产管理:针对本项目范围内所涉及的设施、设备、耗材、工具、软件等等制定严格的管理规范,并落实相关管理岗位责任,保证项目各项资产的完整性。7) 人员管理:根据岗位需要和项目要求,配备具体相关技能、资格证书及资历的服务人员,并制定完善的人员管理与考核制度,保证服务人员的精神面貌、服务水平。8) 配置及数据管理:针对本项目实施所涉及和产生的包括系统资料、规章制度、系统运行要求、运行数据、实施记录等所有与项目有关的信息数据应该进行及时的整理、
4、保存,并根据其关联性形成目录便于查询。超算中心需求分析:超算中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。超算中心中心运维对象共可分成5类:1,机房环境基础设施部分。这里主要指为保障数据中心所管理设备正常运行所必需的网络通信、电力资源、环境资源等。这部分设备对于用户来说几乎是透明的,因为大多数用户基本并不会关注到数据中心的风火水电。但是,这类设备如发生意外,对依托于该基础设施的应用来说,却是致命的。2,在提供IT服务过程中所应用的各种设备,包括存储、服务器、网络设备、安全设备等硬件资源。这类设备在向用户提供IT服务过程中提供了计算、存储与通信等功能,是IT服务最直接的物理载体。3
5、,系统与数据,包括操作系统、数据库、中间件、应用程序等软件资源;还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样看得见,摸得着,但却是IT服务的逻辑载体。4,管理工具,包括了基础设施监控软件、监控软件。这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证到数据中心如何管理好与其直接相关的资源,从而间接地提升的可用性与可靠性。5,人 员,包括了数据中心的技术人员、运维人员、管理人员以及提供服务的厂商人员。人员一方面作为管理的主体负责管理数据中心运维对象,另一方面也作为管理的对 象
6、,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。二, 超算中心运维存在的问题/难点 1、超算中心项目庞大,从设备到人员,相对复杂,统一协调是大问题,导致问题不能及时解决。各部门之间无法形成统一协调的IT系统管理,问题得不到有效的跟踪,也就谈不上及时解决。2、原因不清,导致问题无法根治。如果说统一协调管理问题不得不解决,那么当超算中心的某个流程出现问题时,往往因为找不到故障原因,而无法从根本解决问题的情况,却成为中心很难解决的问题。3、对人的依赖,导致人员变更后的运维问题。如果一个熟练运维人员的岗位发生变更,当
7、问题在出现时,就很难得到迅速处理。即使会有新人继承前人的工作,但他却无法继承前人的运维经验,这成为企业运维成本增加,重复投资的重要原因。4、技术问题,超算技术,机房的维护,需要非常专业的技术,这样对人员的依赖,特别对高技术人才需要是必须的。三,超算中心运维解决方案 人员配置:人员配置原则是双岗制,重要岗位配置双人轮换,以保证人员的更替不会对现有运维管理造成影响,包括不少于以下数量的人员:1.驻场项目经理1名(58驻场,724小时待命);2.机房驻场运维技术主管不少于2名(58驻场,724小时待命); 3.驻场值班团队人员不少于20名(全年724小时驻场值班),持包括电工证、高压证、制冷证、建(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中心 管理 方案
