IT运维流程-问题管理流程.docx
《IT运维流程-问题管理流程.docx》由会员分享,可在线阅读,更多相关《IT运维流程-问题管理流程.docx(30页珍藏版)》请在第一文库网上搜索。
1、问题管理2023年9月28日1问题管理1.1 问题管理的目标问题管理的目标是最小化事故的不利影响以及由于it基础设施中的错误造成的业务上的问题,阻止与这些错误相关的事故的重复发生。为了达到这个目标,问题管理寻求找到事故的根本原因,采取行动改善或纠正这种状况。问题管理流程具有主动和被动两个方面。被动的问题管理关注于解决问题以响应一个或多个事故。主动问题管理关注于在事故首次出现前就能识别和解决问题以及知名错误。1.2 问题管理的范围问题控制、错误控制以及主动问题管理都属于问题管理流程的范围。较为正式的定义是,问题是一个或多个事故未知的底层原因,知名错误是已经成功诊断出来的问题,并且为之定义了临时措
2、施。输入活动输出图1问题管理的范围问题管理流程的输入是:来自事故管理的事故详细信息来自配置管理数据库的详细配置信息任何定义的临时措施(来自事故管理)问题管理的主要活动包括: 问题控制错误控制 问题的主动预防识别问题趋势 从问题管理数据中获得管理信息 完成主要问题的评估问题管理流程的输出:知名错误变更请求(RFC)更新后的问题记录(包括解决方案和/或任何可用的临时措施)关闭问题记录(对于解决的问题)与问题和知名错误匹配的事故的响应管理信息1.3 基本概念在事故的早期阶段,能够得到相应的而且容易应用的建议,对于组织有效地解决事故的能力来说,这是最重要的。服务台接收到的事故,对于支持员工很少是初见的
3、或是神秘的。相似地,处于二线或三线的支持员工中的专家也已经解决了许多困难和原始事故和问题。花费在这些解决方案上的资源的最好使用方式就是将它制作成文档,这样一线的员工就可以应用它们了。问题管理流程试图降低影响业务的事故和问题的数量及危害,因此,问题管理的部分职责是确保以前的信息被记录在档,这样对一线及其它二线支持员工就已经是准备好可用的了。它不是简单地记录文档的问题,它要求:信息应该建立索引,以便根据来自新事故的简单的线索就能容易地查找;进行例行检查,以确保持续的文档记录与变更相一致: 技术 可用的外部解决方案 业务实践和需求 内部技巧 重复事故的频度和影响 阐明内部最佳实践进行详细评估的流程;
4、训练员工使用信息,理解可用信息的深度和作用,以及怎样访问和理解信息,在提供反馈方面,信息的相关性和易于使用; 存贮信息的知识库一典型地基于集成的服务管理工具,使得在登录后或者在事故处理流程的初始分析阶段就能使用知识。一般地使用“专家系统”软件来发挥问题管理流程的作用。然而,重要的是包括专家知识,让使用系统的员工根据反馈来更新: 被识别的问题和知名错误;分析他们遇到的事故(被动问题管理);按时间段分析事故(主动问题管理);分析IT基础架构;提供知识库; 引进新产品时的开发人员和提供商。一般情况下,问题是多个展现出共同特征的事故的结果。有时问题也可以根据单个明显的事故来识别,由单个错误引起,虽然原
5、因未知,但影响明显。知名错误是对问题的根本原因成功诊断后识别的,后续将开发一个临时措施。IT基础架构的结构化分析、来自支持软件的报告以及用户组会议有助于问题和知名错误的识别。这就是主动问题管理。问题控制重点在于将问题转化为知名错误,错误控制重点在于通过变更管理流程结构化地解决知名错误。1.1.1 事故管理和问题管理的不同问题管理不同于事故管理,它的主要目标是事故底层原因的检测,提供后续的解决方案,阻止事故的发生。在许多情况下,这个目标可能与事故管理的目标有直接的冲突,因为事故管理的目标是尽可能快的为客户恢复服务,经常通过临时措施,而不是通过彻底地解决。因此在这个方面,找到解决方案的速度是次要的
6、。底层问题的调查需要花费时间,这样会推迟服务的恢复,但阻止了事故的重复发生。1.1.2 问题控制问题控制流程关注于以有效地方式处理问题。问题控制的目标是识别根本原因,诸如存在错误的配置项,向服务台提供可用的关于临时措施的信息和建议。问题控制流程很相似于,且高度依赖于事故控制流程的质量。事故控制重点在于解决事故,提供临时措施,对特定的事故临时修复。如果对于一个或一组事故,识别出了问题,可用的临时措施和临时修复应该由问题控制流程记录在问题记录中。问题控制流程也对问题建议最佳的可用临时措施。因为问题控制关注于阻止事故的重复发生,因此流程的方法应该被仔细地管理和规划。管理和规划的程度要高于事故控制,因
7、为它的目标只是尽快地恢复正常的服务。优先权应该分配组那些可能引起严重业务中断的问题的解决。在事故控制中的活动包括:问题识别和记录;问题分类;问题调查和诊断;1.1.3 错误控制错误控制包括的流程是,在变更管理流程的控制下,能过成功地实施变更,使知名错误得以消除。错误控制的目标是发现错误、监控错误、在成本合理且可行的时候排除错误。错误控制是开发(包括应用开发、功能扩展和维护)和生产环境的桥梁。在开发阶段产生的软件错误会影响生产运营,在开发和维护环境识别的知名错误会被移交到生产环境。错误控制中的活动包括:错误鉴定和记录;错误评估;记录错误的解决(方案调查、提出变更请求);关闭错误;监控问题和错误的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IT 流程 问题 管理
![提示](https://www.001doc.com/images/bang_tan.gif)