《应用管理系统安全运维管理制度.docx》由会员分享,可在线阅读,更多相关《应用管理系统安全运维管理制度.docx(14页珍藏版)》请在第一文库网上搜索。
1、应用管理系统安全运维管理制度第一章总则第一条 编写目的:为统一规范应用管理系统(以下称本系统)的运行维护管理工作,保障系统正常运行,特制订本制度。第二条 运维管理制度的适用范围:系统主管领导、系统运维人员、系统研发人员。第二章运维部工作职责第三条系统运维和技术支持:(一)根据本系统的实施推进和发展目标,负责系统协同管理及支持数据交换策略调整、技术开发等工作,保障系统持续的、稳定的运行。(二)负责本系统的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决;(三)本系统日常运行过程中信息安全和技术问题的协调解决,保障网站24小时安全稳定运行。(四)负责本系统管理及设备保密口令的设置和
2、保存,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。(五)本系统管理实施过程新的需求方案的设计、开发和升级工作。第四条信息和技术安全应遵循如下原则:(一)执行国家有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理信息技术安全方面存在的问题,确保平台安全、稳定、可靠运行。(二)本系统安全保密制度和工作流程的制定,落实本系统技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。(三)在服务器安装防病毒软件,确保本系统不受病毒和黑客攻击。(四)负责本系统的应急处理预案制定、修订和实施。(五)建立多机备份机制,一旦主系统遇到故障或受到攻击导致不
3、能正常运行,可以在最短的时间内替换主系统提供服务。(六)建立本系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏密码。第三章运维人员及职责第五条 运维管理组织结构为三层模式,具体如下图所示。由本系统的项目负责人与第三方公司进行业务范围接洽,并将沟通结果向下传递。项目经理负责项目的整体运维工作,包括各种制度的制定和实施,以及带领技术支持人员、应用工程师和数据库管理员开展维护工作。项目负责人云服务器管理员第六条运维管理人员及职责:序号职责职责1项目负责人负责本
4、系统整体协调事宜2项目经理负责规划、执行、完善本系统的运维工作,以及本系统的运维工作实施,带领技术支持人员、应用工程师、数据库管理员开展工作3应用、数据库运维负责应用系统的运维,对应用系统的运行情况进行巡检和故障排除。4项目技术人员负责应用系统的技术运维,对应用系统的运行情况进行巡检和故障排除。负责云服务器的协调工作,对服务器硬件管理、操5 云服务器管理员作系统维护、主机漏洞扫描、网络安全、系统性能监控、数据备份等。第七条 运维服务流程涉及技术支持、事件、问题、变更、服务持续性、知识库等,随着运维活动的不断深入和持续改进,其他流程可能会逐步独立并规范。(一)运维服务工作流程图创建汩百.诊断.形
5、成方素专门处理入民重要资薄申请、交更、用艮(二)技术支持人员是支持运维服务的核心,与各个流程联系密切。所有管理流程都要通过技术支持为用户提供联系,解答用户的相关问题和需求,或为用户寻求相应的支持人员。(三)事件主要目标是尽快恢复服务提供并减少其对业务的不利影响,尽可能保证最好的服务质量和可用性等级。事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。事件管理是提供服务台和事件管理者对于事件记录、处理、查询、审核、派发等功能。它也包括通过和第三方监控系统对接,把其发送报警形成事件的功能。(四)工单是现场运维、二线支持的任务载体,运维工程师依据
6、所接收工单进行运维工作。(五)问题主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。问题流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理和发布管理,负责确保解决方案的实施。问题管理还将维护有关问题、应急方案和解决方案的信息。问题是针对已处理事件的遗留问题或处理事件的方案只是治标不治本的不能彻底解决问题而考虑的。根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法。(六)变更实现所有服务器配置和应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响的业务范围。其主要目标是以对服务最小的干扰实
7、现有益的变更。(七)知识库是提供给运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料。便于使用的人机接口、快速查询的技术手段和维护手段。第四章运维服务内容第八条 运维服务目标包括,本系统的主机、数据库和中间件的运行维护服务,保证本系统的正常运行。同时根据日常维护的数据和记录,提供本系统的整体建设规划和建议。本系统运维工作包括两部分,一是日常巡检工作,包括本系统运行情况、主机资源使用情况、数据库运行情况、中间间运行情况等;二是做好本系统应用程序升级、中间件软件漏洞修复、数据库软件漏洞修复等。服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:(一)运
8、行状态、故障情况;(二)配置信息;(三)可用性情况及健康状况性能指标。第九条 提供主机日常运行情况的运维工作,内容包括:(一)CPU使用情况;(二)内存使用情况;(三)硬盘使用情况;(四)备份情况(起止时间、是否成功、出错告警)。第十条提供的数据库运行维护服务是包括:(一)数据库基本信息:文件系统、死锁、CPU占用率较大或时间较长的SQL语句;(二)表空间使用信息监测;(三)Session连接数量监控;(四)查看每日数据备份、数据同步是否正常;(五)报警日志监测;(六)数据库软件漏洞修复。第十一条中间件管理是指对nginx、jetty等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析
9、解决能力,确保中间件平台持续稳定运行。中间件监控指标包括:(一)中间件的连接数量;(二)JVM内存能够及时的进行内存空间回收;(三)检查中间件日志文件是否有异常报错;(四)中间件进程占用CPU情况;(五)中间件进程占用内存情况;(六)中间件软件漏洞修复。第五章应急服务响应措施第十二条 运维项目组制定了详尽的应急处理预案北京市政务服务本系统应急保障预案,整个流程严谨而有序。但在服务维护过程中,意外情况将难以完全避免。为了对本系统实施的突发风险进行详细分析,并且针对各类突发事件,设计了完整的应急处理流程。第十三条应急预案实施基本流程如下:第十四条突发事件应急策略应遵循如下原则:(一)值班人员平时应
10、做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束。对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导。(二)正常情况下,要求值班人员在10分钟内进行事件确认。如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动应急预案,并严格按照应急预案所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况。(三)在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快联系技术工程师赶赴现场援助处理。第六章服务管理制度规范第十五条服务时间应遵循如下原则:(一)
11、在5*8小时工作时间内由专人职守,接收各种内部的服务请求,并记录事件处理结果。(二)在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24小时机房监控人员的机房突发情况汇报。(二)服务响应时间:故障级别响应时间故障解决时间1小时以内低级:系统存在问题,不影响正常使用,10分钟,30分钟例如访问速度较慢,或者由于系统存在内提交故障处理问题,导致部分数据或页面不能正常展方案示等。中级:系统存在问题,正常使用有一定影响,例如部分数据丢失,某个栏目无法打开等。10分钟,30分钟内提交故障处理方案3小时以内高级:系统完全停机,或数据被篡改,页面被篡改。10分钟,1小时内提交故障处理方案6小时以内启用备机第十六条行为规范应遵循如下规范:(一)遵守政务服务本系统的各项规章制度,严格按照相应的规章制度办事。(二)与运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。(三)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。(四)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。(五)遵守保密原则。对政务服务本系统的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。