聚类业务产品应急预案

聚类业务产品应急预案

ID:45615730

大小:337.58 KB

页数:19页

时间:2019-11-15

聚类业务产品应急预案_第1页
聚类业务产品应急预案_第2页
聚类业务产品应急预案_第3页
聚类业务产品应急预案_第4页
聚类业务产品应急预案_第5页
资源描述:

《聚类业务产品应急预案》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、资料编码产品名称湖北联通聚类业务使用对象产品工程师产品版本B12编写部门华为技术支持部资料版本VI.1湖北联通聚类业务产品应急预案拟制:郭康日期:2011-8-25审核:日期:批准:日期:HUAWGI华为技术有限公司版权所有侵权必究目录第1章总体说明11.1目的11.2使用对象11.3适用场合11.4预防措施1第2章应急故障屮告信息收集22.1确认故障来源22.2重人事故场景判断22.3有助于应急故障初步判断的信息收集2第3章应急故障处理总体指导33.1湖北联通聚类业务平台的应急处理流程33.2紧急故障处理冇三个

2、原则需要特别注意33.3人员准备33.4应急组织结构3第4章应急故障场景处理及恢复操作74.1场景3:提供给SP调用的webservice接口无法正常调用74.1.1故障点1:SERVTCEAGENT所部署的TOMCAT服务是否屮断74.1.2故障点2:TOMCAT已运行但SERVTCEAGENT未正常启动。74.2场景4:SP调用短信接口发送短信失败。7421故障点1:短信接口调用失败84.2.2故障点2:短信接口调用成功,提交到网关后发送失败8第5章信息收集95.1IISS故障处理一般流程95.2PORTAL

3、故障处理-般流程95.3SERVICEAGENT故障处理一般流程95.1Windows故障信息收集10第6章附录116.1设备位置11HUAWei湖北联通聚类业务产品应急指导书内部公开6.2组网情况116.3设备IP/用户名/口令116.4软件结构图12HUAWei湖北联通聚类业务产品应急指导书内部公开关键词:应急预案联通聚类业务摘要:木指导书旨在指导联通聚类业务产品工程师在设备、业务重人故障时进行应急处理,以便快速有效的恢复业务,同时也作为办事处工程师技能提升的材料。缩略语清单:第1章总体说明1.1目的联通聚类

4、业务产品应急操作指导书,是针对华为公司聚类业务产品在联通项H平台的运行过程中或者操作过程中可能出现的紧急问题,如用户短信发送失败失败而制定的操作指导,其冃的是在设备发生故障时,提供紧急维护的手段,使故障恢复得尽可能快,从而减少故障的影响。为了在紧急情况下迅速定位解决问题,需要熟悉系统结构,平时详细了解系统配置情况,这是提高故障恢复速度的基础。1.2使用对象联通聚类业务维护人员。1.3适用场合1、用于日常学习,提高应急处理技能。2、作为应急预案的输入,在编写应急预案时,所涉及到的所有技术层面的内容都应该在该指导书屮

5、找到。3、设备出现重大故障时,可以利用此指导书指导维护人员进行故障定位与恢复。1.4预防措施为保证系统稳定运行,尽授大口J能减少突发事故,我们需要做到以下几I1!•1、按照巡检标准对系统进行定期检杳,并对发现的问题及时整改解决。2、及时实施公司发布的预警公告。3、编写好局点的应急预案,对局点信息和产品都心屮有数,有条件的局点可以安排演练。4、请遵照《联通聚类业务FI常维护指导书》屮FI常例行维护部分对设备进行日常维护和重要数据的定期备份,如配置文件、log口志、数据库等。做好维护工具和远程维护的准备。第2章应急故

6、障申告信息收集接到用户或者一线工程师的重人故障屮告,工程师m该在简短、有效的沟通屮尽可能多的了解有价值的信息(通过捉问的方式),并对问题做初步的判断,为后续快速的故障定位提供支撑。以下分为三个方而进行故障确认及前期信息收集。2.1确认故障来源Q1:故障来源的申告人是否在现场,远程维护环境是否可用?Q2:故障的巾告是否可以通过再次确认,是否有误或者戢终用户的反馈不清晰等?2.2重大事故场景判断Q1:(从受影响用户数量方面)用户投诉短信发送失败,经过调杏确认,是一个用户、部分用户、集中在预付费用八,集中在一个地区的所

7、有用户,所有地区用户?Q2:(从受影响业务方面)单个频道业务受阻,所有频道业务受阻等?2.3有助于应急故障初步判断的信息收集Q1:最近是否有维护操作?Q2:服务器、网络设备(防火墙、交换机等)是否有指示灯状态界常,进程日志中是否有大量报错等?Q3:使用的平台、数据库和业务版本信息?第3章应急故障处理总体指导3.1湖北联通聚类业务平台的应急处理流程(1)针对业务故障检查聚类业务的相关进程状态是否止常,通过检查系统资源使用率等方法可以获得。(2)检查是否外购件硕件问题,如服务器或者磁盘阵列数据库故障,针对不同的故障决

8、定采用重启或其他恢复操作。(3)检杏是否网络设备问题。3.2紧急故障处理有三个原则需要特别注意1、尽量通过故障分析解决问题,尽快恢复业务。2、收集必要的日志供定位问题和事示分析,在收集日志和恢复业务发生冲突时,以尽快恢复业务为先。3、避免处理不当导致问题扩人。对于关键操作要谨慎,要及时记录操作步骤,必耍时进行恢复操作。3.3人员准备华为联通聚类业务平台紧急状况处理小组1)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。