文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx

文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx

ID:35975905

大小:20.74 KB

页数:5页

时间:2019-04-29

文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx_第1页
文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx_第2页
文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx_第3页
文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx_第4页
文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx_第5页
资源描述:

《文档项目四_任务4-2_IT服务管理的核心流程-事故管理.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、事故管理事故管理的概念事故(Incident)是指引起或有可能引起服务中断或服务质量下降的不符合IT服务标准操作的活动。这里所指的事故不仅包括软硬件故障,还包括服务请求,例如状态查询、重置口令、数据库导出等。当多个事故需要同时处理时,必须根据事故所造成的影响、事故的紧急程度、解决事件的难易程度等因素确定事故处理的优先级。如果在协议约定的时间内一线支持无法解决事故,就需要更多的支持人员介入,这称作事故升级(IncidentEscalation)。图3-2给出了事故升级(IncidentEscalation)的一般程序。3.3.2事故管理的目标事故管理的目标是在尽可能小地影响客户和用户业务的情况

2、下使IT系统尽快恢复到服务级别协议所定义的服务级别,同时记录事故以便为其他流程提供支持。3.3.3事故管理流程输入事故管理流程的事故可能来自于系统构架任何一部分的用户报告,以及服务台及其相关部门的检测报告和系统的自动检测报告。事故管理流程的输出则是针对所产生事故的解决方案和应急措施。在图3-3中可以看到,事故管理流程与配置管理、问题管理、变更管理、可用性管理、能力管理以及服务级别管理等流程具有密切的联系。Ø配置管理:事故管理在记录和诊断事故的过程中将从配置管理数据库(CMDB)获取有关资源、服务、用户、服务级别及其相互关系的信息;Ø问题管理:问题管理需要根据事故管理所记录的事故信息查找事故发

3、生的潜在原因。而事故管理则需要利用问题管理提供的问题、知名错误(KnownErrors,见3.4.1节的解释)、应急措施等方面的信息快速地解决事故;Ø变更管理:事故管理可以为变更管理制定变更方案提供事故信息,而变更管理所制定的解决方案需要反馈给事故管理。在变更实施的过程中如果控制不当,则可能产生新的事故,因此应该详细记录变更过程和变更轨迹,并将它们与事故记录、问题、知名错误和变更请求等信息存放在同一个配置管理数据库(CMDB)中,或者至少共享关键字以提高接口互通性和易用性;Ø可用性管理:可用性管理需要根据事故管理中记录的事故信息及配置管理中的状态数据评价IT服务的可用性;Ø能力管理:有些事故

4、的产生可能与基础架构组件的能力有关(如网络带宽不够),当出现这类事故时,事故管理应当向能力管理流程提交事故管理报告,以便能力管理重新评价IT组件的服务能力并作出必要的调整;Ø服务级别管理:服务级别协议规定了事故优先级和升级方式,事故管理必须根据这些信息进行事故解决以及与客户进行沟通,而服务级别管理则需要根据事故管理流程提交的事故管理报告评价服务级别目标的实现情况,并据此对服务级别协议进行评审。3.3.4事故管理的主要活动事故管理流程的基本活动简要说明如下:1)事故查明和记录服务台负责查明和记录事故。它将基本信息输入事故数据库并报告给事故管理小组。一般来说,服务支持小组是不允许直接记录事故的,

5、所有事故必须先报告给服务台,然后由事故管理人员根据服务台提供的信息及事故数据库信息判断此事故是否与已有事故相同或相似,如果有就更新事故信息或建立原事故的从属记录,并在必要时修改原事故的影响度和优先级;如果没有则创建新的事故记录。事故管理需要给每个事故分配一个惟一编号,记录一些基本的事故分析信息(时间、症状、位置、受影响的服务和用户以及硬件等)并补充其他事故信息(来自于与用户的交互和配置管理数据库等)。2)归类与初步支持归类是根据事故发生的原因和所需支持的类别对事故进行划分的过程。如果发生的事故是重复出现的,则只需根据已有的经验和措施采取行动即可。如果事故是新出现的,就需要将其与问题和知名错误

6、进行匹配。如匹配成功,就可直接用已有方案解决事故。如果不能将事故与问题或知名错误进行匹配,下一步就是确定事故的优先级,以确保支持小组对事故给予必要的关注。优先级应综合事故的影响度和紧迫性来确定。在确定事故优先级后,服务台应对事故提供初步支持。服务台如果没有成功解决事故,就将事故转交给二线或三线支持处理,然后负责记录事故并协调各支持小组、采取必要的措施以确保用户满意事故的解决过程。3)启动服务请求程序如果该事故属于一项服务请求,则启动服务请求程序,由其他服务管理流程如变更流程、配置管理流程、能力管理流程等流程对服务请求进行适当的处理。4)事故匹配(Matching)当服务台接收并记录有关事故的

7、信息后,需要将发生的事故与问题管理中的问题、知名错误进行匹配。如果匹配成功,则可以根据问题管理中现成的解决方案解决事故。如果匹配不成功,则服务台应将事故转交给事故管理人员,由事故管理人员对事故进行调查和诊断。5)调查和分析如果没有现成的解决方案,事故管理人员应对事故进行分析和诊断,并提出快速解决事故的方案或应急措施。6)解决事故与恢复服务在确定了事故的解决方案或应急措施后,事故管理人员应当立即对事故进行解决以

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。